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Ке t je ЊЕ, T WARD ХЕ ЕН АИ, МЫШЫ. АЙП 
种 国外 教材 中 六 选 测 数 | 种 ， 列 入 第 一 阶段 的 出 版 计划 。 МЕ ШЫК E UE AS ASE MIERA 
师 ， 如 Stallings, Date. Ullman, Aho, Bryant Sedgewick 35, dede ААА Н АС. UP 
从 多 国外 一 流 人 学 如 Stanford University, МІТ, UC Bekerley, Carnegie Mellon Univeristy. 
University of Michigan 等 采用 为 教材 ， 拟 让 的 第 - :阶段 出 版 计划 包括 30 ӘН. IA TER NIY 
Bub. Жанақ, ЕЕ, НАН. ЖЕ. ЖЕН. ЖЕГІН, НЕЕ, EG 
网 络 ， 离 散 数 学 等 计算 机 专业 核心 基础 课程 ， 基 本 满 息 国内 计算 机 专业 的 教学 妥 求 . 

此 外 ， 为 了 帮助 广大 任课 教师 加 滩 对 本 系列 教材 的 理 钥 ， 减 轻 他 们 的 务 课 难度 ， 我 和 们 上 只 国 外 
НЕМА НЕТ ARCE RIER TA R E HRE i E A A HER HAE 2 ARUM 1] 
ШЕШЕЙ, TTS SE Him тҮ ГЫ B) v ААА ЗІНЕ. 

ВЕТЧИНА АК ЖД Ж SGT EE EROR. ЖАБ. BUE. STRUD LUMINE UT 
me r ETEA EHER. МИГ AN EA A ВЕ HLBEVERLE S NIPES E ЖП АЛ 
入 到 我 们 的 工作 中 来 我 们 的 联系 方式 十， 
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WEA CEPR RIEKE BERET ЇЧ ДЕРТ. ИШТ. BRE] ЕДА АЕ ИГИ 
ЖР Р ГААТ НА LUCES. 这 个 函数 实现 在 gec 环境 下 的 编 详 一 点 问题 都 
ОҢ, HHE — kusi, КЕНЕН. RE I WPL. МЕНЫН ЕТЕНЕ 了 一 一 
ШЕНІНЕ ЖЕСТ -个 16MB SIUE SEES SERE. МЕНЯ, еа 不 过 在 这 
16 [a] Ен, ЖЕН m НКМ] LESS E da ER E ЖЫ ERI IEE, ТЇ RE SERRE A ЖИИ ТТ ЕЛА. 
知道 程序 如 何在 计算 机 上 被 执行 。 理 解 计算 机 系统 , 不 是 简单 地 从 所 市 上 购买 一 些 介绍 计算 机 系统 的 
P. 谍 一 读 而 已 。 馈 今 为 小 , 我 对 市 面 上 这 类 书 的 了 解 是 ; 对 于 大 多数 程序 员 而 言 它们 都 过 十 专业 化 ， 
上 以 书 的 内 容 种 语 杏 组 织 上 部 懈 重 填 凰 理 的 介绍 ,一 般 程序 员 很 礁 有 时 间 和 精 瑟 去 消化 和 吸收 书 中 的 
内 容 ， 更 无 从 用 人 这些 计算 机 系统 的 知识 来 帮助 自己 解决 程序 问题 ， 

У, 总 级 语言 编程 各 计算 机 系统 被 编程 坏 境 寻 gee 划分 成 两 张 皮 ， 尽 管 程序 员 能 用 高 级 语 
吝 了 驱动 计算 机 完成 指定 的 计算 任务 , 可 是 却 不 一 定 能 很 清楚 地 知道 计算 机 是 如何 解释 和 执行 程序 代 
码 的 。 

我 本 人 人 是- -个 计算 机 专业 科班 出 身 的 人 人 ， 学 生 期 间 学 习 到 许 凶 关 于 计算 机 系统 的 知识 。 可 在 实 
际 研 究 1 作 中 ， 过 去 所 学 的 计算 机 系统 知识 变 得 过 这 和 横幅 。1999 年 初 ， 出 于 研究 兴趣 的 日 的 ， 我 
设计 了 一 个 喇 性 能 网 络 服务 器 结构 ， 并 编写 了 它 的 实现 。 在 此 期 间 ， 使 我 明白 一 个 高 性 能 服务 器 程序 
了 计算 机 系统 乙 间 的 唇齿 相仿 的 关系 .。 过去， 促使 我 建立 高 级 语言 和 计算 机 系统 的 联系 来 主要 自 于 研 
究 的 庄 力 ， 其 采用 的 方法 是 遍 寻 国外 关于 系统 编程 的 地 性 列表 ， 并 结合 以 往 所 学 的 计算 机 系统 知识 。 
忆 神 方法 固然 能 带 助 我 解决 实际 序 碰 到 的 问题 ,但 却 需要 花费 大 量 的 时 间 且 没有 条 理 。2003 年 元 月 ， 
Au ОТЕ Е LAS MA 一 批 刚 出 版 的 外 文书 中 挑 一 些 可 以 在 国内 推广 的 书 ， 我 一 眼 就 看 中 了 这 本 由 
Bryant 和 O'Hallaron 所 车 的 《Computer Systems: A Programmer's Perspective), 它 就 是 我 过 去 想 要 的 书 ， 
我 相 保 也 是 每 一 个 想 了 解 计算 机 系统 的 程序 员 想 要 的 书 ,我 迫不及待 地 从 编辑 手中 抢 下 此 书 的 翻译 工 
作 ， 这 个 临时 添加 的 任务 改变 了 我 各 另 一 位 译 者 2003 年 的 生活 。2003 年 8 月 底 ， 终 于 完成 此 书 的 翻 
译 工 作 ， 并 起 中 文 名 为 《深入 理解 计算 机 系统 》 

$ 深 入 理解 计算 机 系统 }》 的 最 大 忧 点 是 为 程序 员 描 述 计 算 机 系统 的 实现 细节 ， 帮 功 其 在 大 脑 中 
构造 一 个 屋 次 型 的 计算 机 系统 ,从 最 底层 的 数据 在 内 存 中 的 表示 {如 大 多 数 程 序 员 一 自 隔 生 或 疑惑 的 
学 所 数 表 水 )， 到 流水 线 指令 的 构成 ， 到 虚拟 存 悄 器 ， 到 编 详 系 统 ， 到 动态 加 载 库 ， 到 最 后 的 用 户 楚 
应 用 。 贷 束 本 书 的 -条 主线 是 使 程序 员 存 设计 程序 时 ,能 充分 意识 到 计算 机 系统 的 重要 性 ,建立 起 被 
所 号 程序 可 能 被 执行 的 数据 或 指令 流 图 ， 明 白 当 程序 被 执行 时 ， 名 底 发 生 了 什么 事 。 从 而 能 设计 出 一 
个 高 效 ， 吕 元 植 、 健 壮 的 程 谓 ， 并 能 够 更 快 地 对 程序 排 异 、 调 整 程序 性 能 等 。 

本 世 是 通过 程序 员 的 视角 来 介绍 计算 机 系统 ， 名 首先 把 高 级 语言 转换 成 计算 机 所 能 理解 的 一 种 
中 加 棋 式 《如 汇编 语言 )， 然 后 描述 计算 机 邵 何 解释 和 执行 这 些 中 间 格 式 的 程序 ， 是 系统 的 哪 一 -部 分 
影响 竹 序 的 执行 效率 ， 所 以 ， 在 讲述 计算 机 系统 知识 的 同时 ， 也 顺便 给 出 了 关于 C 语言 和 汇编 语言 


(有 可 能 是 纲 译 系统 产生 的 ) 的 编程 和 阅读 技巧 ， 以 及 基本 的 系统 编程 技 与 和 工具， 同时 ， 还 给 出 一 
些 方 法 帮助 程序 员 基 于 对 计算 机 系统 的 理解 来 度量 和 改善 程序 的 性 能 、 及 其 它 苛 手 门 题 : 

АБ ЕЕ АЖЕ X FL PLA IR S Z J СШ ТЕА) ТЕТЕ АНАҢ, Ud: 
НЕ Өле 汇编 语言 和 汇 . 编 级 计算 机 体系 结构 ; 处 理 器 设计 ; РЕНАН НИЛ. Тен КИД. 
链接 器 和 编 闪 器 ， 包 拓 ЛО МАН ҚЫЛЫ; 虚拟 存储 器 ， 外 部 存储 管理 ， CBAR. Ін ЖІ 
程控 制 。 对 这 些小 闻 领域 项 识 多 介 绍 使 我 们 能 在 编 与 系统 程 夺 时 , АР СРЕ ВЕЕ, ЖИС 
好 的 折 中 方案 。 

本 书 强调 对 计算 机 系统 的 概念 的 理解 ， 但 并 不 意味 着 不 动手 。 如 果 按 照 本 书 的 安排 做 每 一 章 后 
面 的 习题 ， 将 有 动 丁 理解 和 加深 正 文 所 述 的 概念 和 知识 ， 并 具有 时 候 ， 可 以 从 实际 胡 手 中 学 习 到 者 的 
知识 。 如 果 不 动手 ， 空 洞 地 去 看 文字 ， 是 很 难 理解 文字 背后 的 意义 的 。 我 个 人 的 经 验 是 ， 有 许多 系统 
设计 和 概念 ， 看 羽 简单 或 不 理解 , 可 - 旦 自己 圳 手 司 问 样 的 试验 , 7E SEHR (32347 ИЯ ИТ n 
此 设计 , 计算 机 系统 就 像 白 然 界 的 生态 环境 ， 对 每 - -个 部 人 忻 的 设计 都 要 求 它 能 融洽 地 和 系统 内 若 他 部 
件 和 平 相处 , 我 们 不 能 半 在 一 个 微观 的 视角 去 看 待 系统 部 件 的 滩 计 是 洁 最 优 ,出 辜 该 从 窑 观 来 驶 附和 
m5. 

为 方便 理解 本 书 的 由 容 ， 本 书 的 读者 假定 具备 С ЖНЖ. ATIR EF РЫШЫ K 
F (CMU) 的 教 和 烤 ，i 被 其他 一 些 著 名 的 大 学 也 选用 为 教材 ， 因 此 ， 本 书 的 读者 不 仅 仪 是 堵 些 因 
为 工作 和 兴趣 而 关注 本 书 的 人 ,还 包括 些 企 校 的 大 学 生 ， 作 为 他 们 的 教材 或 辅助 福 资 料 。 个 信 认 
为 ， 在 榨 学 生 越 早 接触 本 书 的 肉 容 ， 将 越 有 利于 他 们 学 习 计 算 机 的 相关 课程 ,培养 对 计算 机 系统 的 
研究 兴趣 ， 

总 而 言 之 “深入 翰 解 计算 机 系统 》-.--- 书 是 一 个 桥梁 ， 它 帮助 程序 员 衔接 了 计算 机 系统 的 各 个 领 
域 的 知识 ,为 特 序 员 构 道 了 一 个 概念 性 框架 。 对 于 各 个 领域 (如 计算 机 系统 结构 、 处 理 器 、 МЕ Ж. 
Uis. МА. ЖАНЕ) ВЈ КН, Xe RECS Хз. 

ЭЛЕН ӘУЕЛІ. ЮЕШ ОКУ. (gets sido. 

РАА АЕ, ЖЕШЕТ АЧИ. 尽管 我 们 十 分 努力 , 但 还 是 难以 避免 出 现 错误 ， 
ИЛТТЕ DRABA, KE ARAWE СЕРЕ, 


aus 
2004.2.15 
于 北京 中 关 村 【中 科 院 ) 青年 公 高 


关于 术语 的 翻译 


车 1 跨越 计算 机 的 多 个 领域 ,涉及 了 许多 专业 的 本 许 。 在 翻译 的 过 程 中 ， 我 们 尽 可 能 地 忠实 尽 觅 
忌 广 的 意 总 ， 但 并 不 是 每 个 本 语 的 翻 详 都 那么 恰当 ， 符 合 每 个 读者 的 阅读 习惯 。 不 串 吉 免 地 ， 对 某 些 
术语 的 翻 详 带 了 我 们 个 人 的 半 惯 和 偏好 ,希望 读者 谅解 ,下 夯 ， 我们 解释 在 本 书 中 频繁 出 现 的 一 些 术 
Im B BE. 


directive 


АУЫН Rims C Të = rH inelude 的 语句 , 或 汇编 语言 中 类 似 .pos Erit). BS WT 
Ш, ашу ЇЙ “3587 ЖЗА, АЈНА RER. ІН, ТЕЁ directive 单词 出 现 的 地 
方 ， 还 同时 出 现 了 instruction 单词 【这 种 现象 以 第 3 ЖА), КФУ Ы “Ее” ЖЕЗ 
directive, instruction > A k — F E og f]. y J MB ЖШ ХАҢ А, ИЕА Н. 
拒 们 在 不 影 啊 基 本 意思 的 前 提 下 ， 翻 译 directive 为 命令 ， 


operation 


这 是 个 壕 布 全 书 的 单词 。 它 众 多 的 意思 中 有 两 个 是 :“ 操 作 ” 和 “运算 ”， 对 这 个 单词 的 翻 详 ， 
我 们 没有 熔 用 -一刀切 的 方法 ， 而 是 尽 可 能 采用 国内 读者 的 习惯 来 翻 详 。 根 据 我 自己 的 切身 体会 ， 以 及 
网 友 对 operation 译 法 的 讨论 ， 我 们 喝 舌 向 于 在 数学 的 领域 内 使 用 “运算 凡 而 在 计算 机 领域 使 用 “ 操 
作 ”。 基 于 这 个 认识 ， 以 及 章节 内 容 的 安排 ， 我 们 把 第 2 章 【 该 章 涉 及 大量 的 数学 描述 ) 中 出 现 的 
operation 主要 详 做 “运算 ”， 而 把 其 他 章节 中 的 operation 主要 部 译 为 “操作 ” 需要 注意 的 是 ， 这 种 
划分 并 不 是 绝对 的 。 


memory 5 storage 


memory “ВАЗЕ АЖИ ЖЕ, Rl me Н) “АА” НЕ, WILA 6 
ЖА memory ВЛЕЕ, OUR IXPEBRIEERERUI ДЕ]. AEG UU memory 可 以 是 不 同 容量 、 成 本 和 
访问 时 间 的 存储 设备 ， 我 们 过 去 所 认识 的 memory 只 是 DRAM。 所 以 ， 不 能 把 memory 简单 地 翻译 为 
"RHET 

M memory 和 storage 这 两 个 单词 的 中 文 意思 来 看 ，memory 是 “存储 器 ”而 storage RJ “(ҰШ 
Gua. n9 ЭПА З Я, memory 更 多 地 以 名 词 出 班 ， 朱 述 一 个 静态 的 物理 设备 ， 而 storage 
除了 可 以 作为 名 词 出 现 外 ， 还 有 动词 前 形式 〈store storing 和 stored)。 所 以 ， 我 们 取 memory 的 中 文 
意思 为 “存储 大 ”"， 而 取 storage 【以 及 store. storing 和 stored). 前 中 文春 思 为 “ 存 情 ?。 除 此 之 外 ， 妇 
А{Е АЛЕ, A memory 和 storage 同时 出 现时 ， 我 们 除了 给 出 storage 韵 中 文 释 义 外 ， 还 尽 可 能 地 
BHCHR], DIL memory 的 区 别 ， 


hazard 


Е RI AAA EE УИШН ЖЕ. o ns ВИНЕН Е А “ВЕ” А, 
我 们 在 做 学 生 时 ,大 都 起 呼 它 的 英文 , 很 少 浇 它 的 中 文 , ЕН ERAR К AAR BCDUII ЗИ. 
曾经 有 一 个 网 友 告 诉 我 ， 他 看 到 一 个 “险象 ”的 译 法 比较 贴切 。 呵 阿 ， 为 了 这 个 术语 的 翻译 ， 我 相 他 
在 网 上 争论 了 两 天 。 季 细 想 想 “险象” 这 种 译 法 ， 确 实 不 为 错 ， 但 还 不 能 完全 说 服 我 选用 它 。 因 为 ， 
这 个 释义 矿 过 阶 生 ， 许 多 读者 可 能 无 法 联想 到 其 对 应 的 英文 单词 。 市 选用 “冒险 ”， 尺 管 椒 是 乾 么 完 
美 ， 但 是 大 多 数 赋 究 体 系 结构 的 读者 会 很 熟悉 。 所 以 ， 对 “冒险 ”的 选用 只 是 一 种 当 惯 和 区 认 。 


timer 


іше ІТФХЖУЯ. “Ө, Ия” 尽管 这 两 个 中 文 释义 都 可 以 描述 一 个 现象 ， 间隔 一 段 
时 间 后 产生 : 个 事件 ,但 是 我 们 认为 这 两 者 之 间 是 有 区 划 的 ,从 中 文字 面 来 说 ， 定 时 器 鸭 间 隅 更 多 是 
固定 的 ， 倾 回 丁 静态 性 ， 而 计时 器 的 间 取 更 多 蚌 不 因 定 的 ， 有 计算 的 意思 ， 棋 和 同 于 动态 性 。 所 以 ， 焉 
术 书 的 第 9 章 中 【该 章 主 要 描述 系统 评价 )， 我 们 主要 把 timer ЕДИ, ПИ АЕ B 
定时 器 。 


local 


local 的 中 文 释 义 是 ;“ 本 地 ， 局 部 ”"。 我 们 没有 严格 地 区 分 它 ， 完 全 是 根据 上 下 文 描述 的 方便 ， 
来 选用 不 同 的 释义 ， 

诛 书 还 出 现 了 一 些 错误 ， 这 些 错 误 只 是 我 们 个 人 认为 的 ， 和 殷 有 可 能 是 我 们 理解 错 了 。 所 以 ， 找 们 
在 “ 算 改 ”原文 的 意思 时 ， 还 尽 可 能 地 给 出 了 原文 的 意思 ， 以 帮助 读者 杜 别 。 

我 很 亡 欢 这 本 书 ， 且 认为 它 的 内 容 在 $~10 年 内 都 有 它 存在 的 己 值 。 但 是 ， 览 于 我 们 的 能 为 和 时 
间 有 限 ， 不 能 保证 完全 出 实 、 准 确 地 重 述 原文 的 意思 ， 还 需要 广大 读者 的 支持 。 希 望 六 大 访 者 佳 赔 读 
本 书 的 时 候 能 积极 地 给 我 们 指出 其 中 钳 误 ,改善 此 书 的 质量 ,方便 后 来 的 读者 从 中 更 顺 牧 地 获取 知 雏 ， 


B ri 


《深入 理解 计算 机 系统 》(Computer Systems: A Programmer's Perspective, CS: APP) 这 本 书 的 主 
要 读者 基 那 些 想 遂 过 学 习 计算 机 系统 的 内 在 运作 而 提高 自身 技能 的 程序 员 。 

我 们 的 日 的 是 解释 所 有 计算 机 系统 的 本 质 概 念 ， 并 向 你 展示 这 些 概念 是 如 何 实 际 地 凡 附 度 用 各 
序 的 工 确 性 、 性 能 和 实用 性 的 。 与 其 他 主要 针对 系统 构造 人 员 的 系统 类 书籍 不 同 ,这 本 书 是 号 给 程序 
员 的 ， 是 从 程序 员 的 角度 来 描述 的 。 

出 果 你 学 习 和 研究 这 本 节 里 的 概念 ， 你 将 步 和 稀缺 的 “权威 程 序 员 ”的 行列 ， 将 知道 事情 契 如 
但 运作 的 ， 也 知道 在 出 现 故 障 时 如 何 进行 修复 。 同 时， 你 也 将 做 好 学 习 其 他 具体 系统 主题 的 准备 ， 比 
ЕНЕ, ШАЛ ЖААН. ВЕКА. ЖАХИН. 


读者 所 应 具备 的 背景 知识 


本 书 中 的 苑 例 是 基于 英特尔 兼容 的 处 理 器 (英特尔 称 之 为 “IA32”， 即 俗称 的 “x86”)、 在 Unix 
或 类 Unix 《比如 Linux) 操作 系统 上 运行 的 C 语言 程序 。( 为 了 简化 我 们 的 描述 ， 我 们 将 用 Unix 统称 
Solaris 和 Linux 这 样 的 系统 ,) 文中 包括 了 大 量 已 在 Linux 系统 上 编 闫 和 运行 过 的 程序 范例 。 我 们 很 
设 居 能 访问 一 台 这 样 的 机 器 ， 并 且 能 够 登录 ， 然 后 做 一 些 诸如 修改 日 录 之 类 的 简单 操作 。 

如 村 性 的 计算 机 运行 的 是 Microsoft Windows 系统 ， 你 有 两 种 选择 。 第 --， 获 取 一 个 Linux К 
内 《参见 wwwlinux.org 或 者 www.redhat.com)， 然 后 以 * 双 重启 动 ” 模式 安装 它 , 这 样 你 的 机 器 就 能 
运行 尾 一 个 操作 系统 了 。 另 -种 选择 就 是 ， 道 过 安装 Cygwin LH Cwww.Cygwin.com), ЖӘНЕ 
Windows 下 得 到 一 个 类 似 Unix 的 shell 以 及 一 个 非常 类 似 于 Linux 提供 的 环境 。 术 过 ，Cygwin 并 不 
能 提供 所 有 的 Linux 2768. 

我 们 还 假设 你 对 C 和 C++ 有 一 定 的 了 解 。 如 果 你 以 前 只 有 Java 经 验 ， 那 么 这 种 转换 将 需要 你 白 
已 付出 更 多 的 努力 ， 直 过 我 们 也 将 帮助 你 。Java ЛІС 有 相似 的 语法 和 控制 语句 。 

但 是 , 有 一 些 C 语言 的 内 容 ， 特 别 是 指针 、 显 式 的 动态 存储 器 分 配 和 格式 化 O, Java 中 都 是 没 
有 的 。 所 笠 的 是 ，C 是 一 个 较 小 的 语言 ， 并 且 在 Brain Kernighan 和 Dennis Ritchie ІНІ “K&R” X 
字 中 得 到 了 清晰 优美 的 描述 [40]。 无 论 你 的 编程 背景 如 何 ，K&R 都 应 是 你 个 人 图 书 收藏 的 一 部 分 。 

这 本 书 的 前 几 童 揭示 了 C 语言 程序 和 它们 相应 的 机 器 语言 程序 之 间 的 交互 作用 。 机 器 语言 示例 
都 是 用 运行 在 Intel IA32 处 理 器 上 的 GNU GCC 编译 器 生成 的 ， 我 们 不 需要 你 以 前 有 任何 硬件 、 机 跨 
id n BEY SIS EAS. 


S CHRSSES. ХЕСЕН 


为 帮助 СЖЕЙЯКЖҰЛАНЫ (Жл Жа) ЭЖ, aTa 中 一 此 重要 特性， Ana 
TENKE. ЯЛИНА C++ Java, 


怎 标 阅 读 此 书 


从 自序 员 的 角度 来 学 习 计算 机 系统 如 何 工作 将 非常 有 元, 主 归 是 因为 这 个 过 程 本 以 非常 于 动 。 А 
沦 何 时 你 学 到 一 些 新 的 东西 ， 都 可 以 马上 试验 并 下 直接 看 到 运行 结果 。 事 实 上 上 ， 我 们 相信 学 习 系 统 的 
ЕЛА АИИ (do) 系统 ， 即 存 真 下 的 系统 荆 解 人 有 具体 的 门 题 ， 或 中 编写 和 运行 程序 ， 

SHERDE FEB. ИА 个 新 法 念 时 ， 紧 随 其 后 的 将 是 个 或 多 个 练习 题 ， 你 应 该 马上 柚 
做 米 检验 你 的 悍 解 。 练 习题 的 解答 在 每 章 的 末尾 。 当 你 阅读 了 时， 党 试 白 己 来 解答 每 个 问题 ， 然 后 内 查 
Иж. GERCER. 每 一 音 后 面 都 有 “ 织 不 同 难 度 的 家 庭 作 业 题 。 你 的 指导 老师 在 教师 手册 中 
人 这 兰 问题 的 答案 。 对 每 个 家 庭 作 炎 题 ， 我 们 标注 了 我 们 认为 的 难 虚 级 刊 ; 

e Hume LPR ET i Sg. 

专 旬 可 能 而 时 将 所 20 分 钟 。 通 常 包括 编写 和 测试 Seem, ТРЕНИНГ ЖЫН Н. 

** R КИ), ШИЕ 1~2 个 小 时 ,一 般 包 所 编写 和 测试 大 量 的 代码 。 

ФФФФ ЕЧ, ШОК 10 个 小 时 。 

X LB VI ЛИ АЕ С 程序 ， 经 过 版 本 为 2.95.3 的 GCC 编译 并 在 内 核 版 本 为 2.2.16 的 Linux 
系统 上 测试 后 所 接生 成 的 ， 没 有 任何 人 为 的 改动 。 所 有 源 程 序 代 码 均 可 从 本 书 的 主页 (csapp.cs.cmu. 
edu) LRR. гт, WEET СОА ТЕРА АКРА А2, KTR IERRA. Ew, 
РІ 中 的 程序 能 在 code/intro 日 录 下 的 hello.c XERRA. RERI А ex re ЫН, 
TETRISI AS A L KOK fT КИЙ. 


codt/intro/hello.c 


i Binclude -stdlio.n- 

2 

3 int maini! 

3 Í 

5 ргіпі "helio, world*sr"!; 
8 j 


codeAntrofhello.c 


ЕРІ 一 个 典型 的 代码 示例 


ығ» ЯЗ OH ӨЙ” КЕШ) 包 依 了 一 些 你 可 能 会 觉得 有 趣 但 可 以 略 过 而 不 影 啊 阅 读 连 员 
性 的 东西 ， 


SE: MARRE? 

ERPF, 318318 # ЯН AGE ua. PANERA. ЖЫЙ ША] e 
%-8ҮЖ, ИҖЕК НМ. 4 0 5 pak, 5i. C. Linux Жж Intemet 是 从 何 而 来 的 ? Ж 
Rr, ФЕАНАМИТЕПЕЖТАНИЕЯНЫЯ, Өш, БЕНД. BERAIEN? 还 有 的 
ЕЖ, Fitak ati], Hd. ЛФ НЕД АИТ, SETA 
真正 的 IBM 磁 表 驱动 器 看 上 去 是 件 么 样子 。 RE, ИЖИЛ Ж. Hi, АЖ 
"hoinky" ? 


把 一 个 节 量 来 法 转化 为 -- 系 列 的 称 位 和 加 法 , 我 们 用 C БИУЙ ЖЕЕ ЖАНН ti p ORCI a ЖД 
应 用 。 我 们 从 如 何 表 示 浮 点 值 和 浮 点 操作 的 数学 属性 方面 讲述 IEEE 标准 的 浮 点 格 成 。 

对 计算 机 算术 的 深刻 理解 是 写 出 可 靠 程 序 的 关键 。 比如, 不 能 用 (х-у<0) ERA xey), 
因为 可 能 会 产生 洲 出 。 其 全 也 不 能 用 表 这 式 (-y<-x)》 来 取信， 因为 在 二 进 制 补 码 表 水 中 贷 
数 和 下 数 的 泡 围 是 不 对 称 和 的 。 算 林 溢出 是 程序 异 误 的 一 个 常见 根源 ， 然 而 很 落 有 卡 从 一 个 程 
怪 员 的 前 度 去 讲述 计算 机 算术 的 特性 。 

第 3 章 : 程序 的 机 器 级 表示 。 我 们 教学 生 如 何 读 由 CC 编译 器 生成 的 (A32 汇编 语言 。 我 们 说 
明 为 不 同 控制 结构 ， 比 如 条 件 、 和 多 环 和 开关 语句 ， 生 成 罗 基 本 指令 模式 。 我 们 还 讲述 过 等 风 
执行 , 包括 栈 分 配 、 寄 存 器 使 用 惯例 和 参数 传递 .我 们 讨论 不 可 数据 结构 如 结核 、 联 全 (union) 
ПИЯ АС nit. 学 习 本 章 的 概念 能 够 帮助 学 生成 为 晶 好 的 程序 员 ， 因 为 他 们 侍 得 
他 们 的 程 寿 在 机 器 土 是 如 和 何 表 示 的 。 另 外 一 个 妙 处 在 于 学 生 们 对 指针 有 了 其 体 的 了 解 ， 
第 4 章 : 处 理 器 体系 站 构 。 这 - 章 讲 述 基 本 的 组 合 和 时 序 罗 辑 元 素 ， 并 展示 这 些 元 素 在 数据 
路 和 (datapath) 中 如 何 组 全 到- 起， 来 执行 IA32 指令 集 的 -- 个 称 为 “Y86” 的 简化 于 集 。 
我 们 从 设计 单 时钟 周期 、 目 六 水 线 化 的 数据 路 径 开 始 ， 然 后 扩展 成 一 个 五 阶 毁 、 流 水 线 化 内 
没 计 。 本 章 由 椒 理 器 设计 的 控制 敢 辑 是 用 一 种 称 为 НСІ, 的 币 单 硬件 描述 语言 案 指 述 的 。 用 
НСІ, МЕИ НЕЗ d VE И ЕЕЕ АВ ОНИ ЛКЕН ЕНУ ТА A o 

$53: 优化 程序 性 能 ,在 这 一 竟 里 ， 我 们 介绍 许多 提高 代码 性 能 的 技术 。 我 们 从 与 机 器 无 
关 的 程序 转换 开始 , 这 些 标 崔 是 在 任何 机 器 上 写 任 何 程序 时 部 应 该 遵 御 的 。 然 后 是 那些 功效 
有 赖 于 日 标 机 器 和 编译 品 特 性 的 转换 , 为 了 促进 这 些 转换 , 我 们 介绍 了 :个 简单 的 操作 模型 ， 
ЕО ГАИА РЕ 《out-of-order) 和 处 理 器 是 如 何 工作 的 ， 然 后 同学 生 们 展示 向 样 利用 这 个 模 
型 来 改进 他 们 的 全 程序 的 性 能 。 

$63: 存储 器 屋 次 结构 。 对 应 用 程 弃 员 来 说 ,存储器 系统 是 计算 机 系统 中 最 直线 可 见 的 部 分 
之 --。 到 日 前 为 止 , 学生 们 一 直 认 问 这 样 一 个 存储 器 系统 概念 模型 ， 认 为 它 是 一 个 有 一 般 访 问 
时 间 的 线性 数组 。 实 际 上 ， 存储器 系统 是 一 个 出 不 同 容 量 、 造价 和 访 补 时 人 间 的 存 久 设备 组 成 的 
司 议 丫 构 。 我 们 讲述 不 同类 型 的 随机 椰 取 存储 器 (RAM) ЖЯ ТЕЕ (ROM) 以 及 现代 磁 
盘 骤 动 器 的 儿 何 形状 和 组 织 构造 . 我 们 描述 这 些 在 峙 没 备 是 如 何 放置 在 层次 结构 中 的 ， ИЗД 
加 局 部 性 是 如 何 使 这 种 层次 结构 成 为 可 能 的 。 我 们 通过 个 独特 的 观点 使 这 些 理论 具体 化 、 形 
а, ЛЕСЕ У) “ТҰН ЫП”, 山 兰 是 时 间 局 部 性 ， 而 斜坡 是 空间 局 部 人 性。 最 
后 ， 我 们 问 掌 生 们 阐述 如 何 通 过 改善 时 间 和 空间 局 部 性 来 提高 应 用 程序 的 性 能 ， 

$71: id. 本章 讲 述 静 态 和 动态 链接 ， 包 括 的 概念 有 可 重 定位 的 【relocatable) Ant 
行 的 日 标 文件 、 符 号 解析 、 重 定位 〈relocation )， 静 态 库 、 共 导 月 标 库 ， 以 及 与 位 置 无 关 
的 代码 。 大 过 煞 系统 韦 中 都 不 涉及 链接 ， 而 我 们 出 于 下 面 几 个 原因 辈 讲 述 它 。 第 一 ， 学 生 
们 过 到 的 最 这 惑 的 问 是 中， 有 一 些 是 和 链接 时 的 小 故障 有 关 ， 睫 其 是 对 那些 大 型 软件 包 来 
员 。 第 一 ， 链 接 器 生成 的 日 标 文 件 是 与 一 些 像 可 载 、 虚 拟 存 依 器 和 存储 器 映射 这 样 的 概念 
ЖЖ. 

$83: 异常 控制 流 。 在 课程 的 这 个 部 分 ， 我 们 通过 介绍 异常 控制 流 〈 比 如 ， 正 常 分 支 和 过 
ЖАҢ БШК ИСИ) 的 一 般 概 念 和 打破 单 一 程序 的 模型 。 我 们 给 出 存在 于 系统 所 有 层次 
的 异常 控制 流 的 例 了 六， 从 底层 的 订 件 异常 和 冲突 ， 到 并 发 进程 的 上 下 文 切 换 ， 到 Unix 信号 


本 书 的 起 源 


APERT 1998 年 秋季 我 们 在 卡 内 基 梅 隆 (СМИ) 大 学 开设 的 一 门 编写 为 15-213 的 介绍 柱 庶 
Fé: 计算 机 系统 性 论 (Introduction to Computer System, ICS) [71s АЯТ, AF HAR Г ІС 
ГЛАВ, SHETE 150 名 左右 的 学 生 ， 大 多 数 是 计算 机 和 料 学 和 计算 机 上 程 专业 一 年 级 的 常生 。 后 来 ， 
这 了] 妇 程 还 成 为 了 卡 内 基 梅 隆 大 学 计算 机 科学 系 以 及 电子 和 计算 机 并 称 系 中 大 多 数 癌 级 系统 深 程 的 
«dq Ye WR. 

ICS Bs B RR HARRA SEE ТАНИН. ЖА, ИПИЕ ЛОРУНА А ЕВ, 2 
КЕТЕ. я ЛШ. KERZE, АВИ НЛ, ISI RER RELATA STE 
Аа, ВО ПД: MET АНУ ЕНУ ЖИЕ ЖЮ. EE HUGE IE ЈЕ: 我 们 只 讨论 那些 影响 
H1 se СЕРЕН ВЕ, НЕН ЕН ЕШ. 

Беди, ЖЇК J ЖШШЕ ЛЕ an ДЫ ИПАР +. 虽然 我 们 谈 太 了 机 器 语言 , НЖЖ 
iE ИН а Жап, MEAD C ЕШТЕ НАН, ӨШЕДІ ЕДЕН. ЙЫ. ШК 
ЧЕН ADAE KH X (switch) АЛЫ. SSUE-0b. ВА ЕРМАКА, ВНЛ 
ЖОК. AREE T ER HE. BE. (58. HERRE. ҰНЫ. ШОШ ДАДЫ ST KP 

АЯН HIA VR ТСБ 课程 的 方式 对 学 生来 讲 既 实用 、 其 体 , 还 能 动手 ， ШЕ Eq НЕ А! 
学生 的 根 极 性 。 很 快 地 ， 我 们 收 到 来 自学 生 和 教 职 工 非常 热烈 和 积极 的 反 啊 ， 我 们 意识 到 卡 内 大 梅 降 
人 学 以 外 的 其 他 人 也 可 以 从 我 们 的 方法 中 获 荔 。 因 此 ， 历 时 尚 年 , 这 本 书 从 ICS 课程 笔记 中 度 运 而 生 
f. 


E. 5105 有 关 的 数字 

IR ICS 课程 宵 关 的 数字 很 特别 。 在 第 一 学 期 过 半 的 时 候 ， 政 们 发 现 译 程 的 篇 中 (15-213) ERA 
ТАКАЛ, ҢА. Жж ТАНЕ: “15-213: 蛤 予 卡 内 基 梅 降 大 学 精神 的 课程 !1”， 
ARAR, dau X 1 42001 年 2 А 13 8 C21301) 印 剧 的 ， 当 我 们 在 SIGCSE 教育 会 以上 
КЕГІ, ARRET 213 房间 ， 并 且 此 书 的 最 后 一 版 有 13 个 童 节 。 好 在 我 们 并 不 迷信 1! 


本 书 概述 


本 节 由 13 章 组 成 ， 关 在 阐述 计算 机 系统 的 核心 概念 ， 

° 第 ] 章 : 计算 机 系统 漫游 这 - ' 章 通过 研究 “hello, world” 这 个 简单 程序 的 生命 周期 ， 介 绍 
计算 机 系统 的 主要 概念 和 主题 ， 

e $23: 信息 的 表示 和 处 理 。 我 们 讨论 计算 机 算术 ， 重 点 猫 述 对 程序 员 有 影响 的 雹 符号 和 -… 
进 制 补 码 (two's complement) 的 数字 表 朱 法 的 特性 。 我 们 考虑 数字 是 如 何 表 未 的 ， 凡 及 出 
此 箭 定 对 于 一 个 给 十 的 字 长 ， 共 可 能 编 生 值 的 范围 。 我 们 探讨 有 符号 和 无 符号 数字 之 间 类 型 
园 换 的 效果 ， 还 净 述 算术 操作 的 数学 特性 。 学 生 们 很 惊奇 地 了 解 到 (一 进 制 补 码 表 泵 的 ) s 
个 下 数 的 和 或 者 积 林 以 为 负 ， 另 -方面 ， 一 进 制 补 码 算法 满足 环 的 特性 ， 因 此 ， 编 诺 器 可 以 


| zip 掺 有 “ 则 政 编码 ”也 有 “精神 ”之 意 ， 一 一 译 者 
2 SIGCSE 代表 Special Interest Group on Computer Science Education， 计 算 机 科学 教育 特殊 兴趣 组 ，- 一 - 译 者 


传送 引起 的 控制 流 窒 变 ， 到 C pate tele МАЕ ESSE (nonlocal jump}. 

存 这 一 章 ， 我 们 还 向 学 生 们 介绍 进程 前 基本 概念 ,学 牛 们 了 解 进程 是 如 何 汪 作 的 ， 以 冀 
如 何在 应 用 程序 中 创建 和 操 雇 进程 。 我 们 向 他 们 展示 应 用 程序 员 如 何 通 过 Unix 系统 调用 全 
用 刻 进 种。 学 完 本 章 ， 他 们 就 能 够 编写 带 作 业 控 制 的 Unix HAT. 

e 393%: 测量 程序 运行 时 间 。 这 - - 章 教 给 学 生计 算 机 是 如 何 理 解 时 间 的 [时 间 间 隔 计 时 器 、 
CPU ЖАНҒАНЫ Ceycle timer) 和 怒 统 时 钟 ]， 当 我 们 试图 用 这 些 时 间 来 测量 各 序 运行 时 时 间 
的 错误 根源 ， 以 虽 怎样 运用 这 些 知识 来 得 色 准 确 的 度量 值 。 据 我 们 所 知 ， 这 是 惟一 的 在 以 前 
还 末 以 任何 常规 的 方式 讨论 过 的 内 容 , ТИЕ РЕЙ ЫЫ ҰЛАН SS B. XE 
Fee Ж {ТЕ IM. 

е 第 10%: ERAR. Rü НИНДИ КАСНО АРАТ АЈС ІТ Г. 
ЖИІ ЕЕ ТЕНТЕК А ВА АНАУ АЕ, НЕЗ ЖЕЙ, {Н 
55 —H Ы АЈ, ДИ: а ЕРТЕ ЕЕЕ Е. ЖЕЛІ, {ПГ 
ТАН ye eE, КШ Unix Bj malloc 和 free ЕД, ИЛШАТ Р РАЛ. € 
ЛП ГЕТЕ ЕП] Н. Rn T NH. ФЕРЕ МУР ААА Е Ў о ВВЕ 
ЕЖЕН ОЛ TAAA EAE ДІҢ А ҒАН АНЕ. RE. ТЖМ 
RIBER Ы H GREE T ЕЛЕР ТЕТ А ЛУ ЕРЕ BU a w КАНЕ. 

e 第 il X: 系统 级 UO。 我 们 讲述 Unix VO 的 基本 概念 Bl E PERDRE. 354 1 8 4048 t 
享 文件 ，LO SB LER, Жала ӘНІН ӘНЕ. RIEF Т ШЙ 
带 缓冲 长 的 TO 包 , 可 以 正确 处 理 short counts, ВИП С 的 标准 ГОН, ГДЕ у Unix VO 
ЮХА, АНЕ TO АЈА, АЕ ЛЕТ АНЕ. НЯ, КЕЈ 
t x X fe DLP 28 H F ЕН. 

е 第 12%: 网络 编程 。 对 编程 而 言 ， 网 络 是 非常 有 趣 的 VO RE. ATEREA 2] 
НО, BIER. f. TUER (byte ordering)、 存 储 只 映射 和 动态 存储 器 分 筷 ， 联 系 
在 一 起 。 网 络 程 序 还 为 并 发 提供 了 强制 性 上 和 下文， 这 是 卜 - 章 的 论题 。 本 章 是 网 络 编 各 的 风 
АЕ, ЖЕЛПІНЕ АҚ Web 服务 器 。 我 们 还 讲述 位 于 所 有 网 络 程序 底 尼 的 客户 疹 - 服 分 
器 模型 我 们 展现 了 -个 程序 员 对 шете 的 观点 ， 并 且 教 给 学 生 们 如 何 用 套 接 字 (socket) 
ЖЖ э Internet 客 万 病 和 节 务 器 。 最 后 ， 我 们 介绍 超 文 本 传输 协议 HTTP， 并 开发 了 一 
个 简单 的 迁 代 式 (iterative 》Web 服务 器 ， 

e $133: 并 发 编程 。 这 : 章 以 Internet 服务 器 设计 为 例 同 学 生 们 介绍 了 并 发 编程 。 我 们 比较 
对 照 了 三 种 编号 并 发 程序 的 基本 机 制 ‘进程 、VO 多 路 复 用 技术 以 及 线程 y)， 并 此 晤 未 如 柯 用 
tH ЖЯ ЕНӘ шеше: 服务 器 。 我 们 探讨 了 用 Р. V 信号 操作 ， 线 程 安全 和 可 重信 
(reentrancyy， 站 种 条 件 以 及 死 锁 等 来 笑 现 同步 的 基本 诛 则 。 


可 以 基于 本 书 的 课程 


指 隆 教师 可 以 司 用 本 书 来 教授 五 种 不 同 的 系统 课程 ( 儿 P2), ЕМЕНІ ТАРЫНЫ. 个 


Amii ЕЕННЕЯНЕ)). ВЕЕ АЕ, 逐渐 强 证 以 程序 员 的 角度 看 待 系统 ， 以 下 是 简单 
UTD: 


* ORG: —[]) [4&% А ЮЛ ЯНЕ E EE k R SERER. ESRB ЖЕ ЫЕ Н y VI 
Ra K ЖАНЫ. ТЕН ЖИР КИТ. ЖАП. КЕНЕНІҢ ШАНА ШІ. ЖИГ, 
3E R ЖЕЕ КЛА С ЖН. TEE AAAA HNE = Kok C 结构 。 

e ОҢС+: ORG 课程 特别 强调 硬件 对 应 用 程序 性 能 的 影响 ， 和 ORG 课程 相 比 ， 学 生 归 更 多 地 
学 习 代 和 玛 优 化 和 改进 他 们 C 程序 的 存储 器 性 能 。 

е [ICS; 其 本 的 ICS 课 得 ， 旧 在 培养 开明 的 程序 员 ， 他 们 理解 硬件 、 操 作 系统 和 妨 诺 系统 对 应 
用 程序 的 性 能 和 正 铺 性 的 影响 。， 和 ORCHER N-ARE SER, ЖЕНЕ RAE AERE аў 
体系 结 铭 。 相 反 地 ， 程 序 员 与 现代 乱 序 处 理 器 的 高 级 模型 打交道 ，ICS АУДЫ E НЕҢ 
一 个 10 周 的 学 期 ， 如 果 步 调 吉 从容 一 些 ， 也 可 以 延 攻 为 一 个 15 周 的 学 期 。 

. ICS: 基本 的 ICS 谋 程 ， 额 外 论述 一 些 系 统 编 程 问题 ， 比 如 系统 级 UO. WEBER YH 
程 ， 这 基 一 门 一 学 期 长 度 的 卡 内 基 梅 隆 大 学 课程 ， 会 讲述 本 省 中 除了 低级 处 理 路 体系 结构 以 
М-Ж. 

« SB; DRAR. A CSAR HERA FAAR Eina ЖИ 
FE, ИШЕ. ПЕЕ. RAR VO. MRR MEC, a Н пу EZ EUR 
Ж ИА Ata q РД МШЕЗ Л. ЕЛГЕ (daemon). НІ Unix IPC 进程 间 
通信 )。 
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并 发 编程 





图 P,2 五 门 基于 本 书 的 课程 
HES GO Rf. (b) 无 动态 存储 分 配 : (c) 无 动态 链接 : GD 汇 浮 点 ，ICS+ 足 卡 内 其 梅 隆 的 15-213 RR. 


АР 监 表 达 的 主 归 信 息 是 本 书 给 了 你 多 种 选择 。 如 末 你 希望 你 的 学 生 更 多 地 了 解 低 级 处 理 器 体 
ARE. ЖАП ORG 和 ORG+ 课 程 可 以 达到 日 的 。 另 一 方面 ， 如 果 你 银 将 当 朋 的 计算 机 组 成 诛 特 
+ ЙЕНЕ ICS 或 者 ICHAR, 但 是 又 担心 突然 做 这 样 狂 烈 的 变化 ,那么 你 可 以 乏 步 递增 转 问 ICS ЖЖ. 
еМ OGR RER EA -种 非 传 统 的 方式 教授 传统 狗 问 题 。 一 三 你 对 这 些 内 容 感 到 驾轻就熟 


Т. ДЕ ORG+, Ж 8] ICS. in E SS СИЕЗ (ПЕШ ПН] Jaya 编 过 程序 》， 你 
n ЛЕЕ С F, Ж ШИЖ ORG 或 者 ICS ТЁРЕ И. 

En. 我们 法 为 ORG+#i Sp АА АЯН ОРНЫ». en L 
Hi W ICS 和 一 期 SP 的 方式 来 教授 ICS+ 课 程 。 


课 浓 测试 的 实验 练习 


ЕР ЖЕРІМ ICS+ 课 程 得 到 7 PHIR aR. R RAPENA EA 5050, TE 
分 数 一 般 为 4.6/5.0。 学生 们 表扬 说 这 门 课 非常 有 趣 ， 令 人 兴奋 ， 证 要 就 是 因为 相关 的 实验 练习 。 下 而 
尽 本 书 提供 的 一 些 实验 的 示例 。 


数据 实验 、 这 个 实 纶 此 求学 生 们 实现 简单 移 逻 辑 和 算术 滑 数 ， 但 是 只 能 使 用 个 高 度 受 限 的 
C 的 子 集 。 比 如 ， 他 们 必须 只 能 内 位 级 操作 来 计算 一 个 数学 的 绝对 值 。 这 个 实验 帮助 学 生 们 
了 解 忆 数据 类 型 的 位 级 表示 ， 和 数据 操作 的 位 级 行为 。 
二 进 制 炸弹 实验 。 二 进 制 省 弹 是 个 作为 日 标 代码 文件 提供 络 学 生 们 的 程序 。 运 行 时 ， 它 提 
AH FUR 6 个 不 同 的 字符 串 。 如 果 其 中 的 任何 一 个 不 正确 ， 炸 洋 就 会 “爆炸 ”， 打 印 出 一 
条 错误 信息 ， 并 日 在 分 级 (grading). 服务 器 上 记录 事件 日 志 。 学 生 们 必须 通过 对 程序 反 汇 编 
HER TERI EMAER 6 T ДАРИ А BEREE., BLAAS E ERR 
Seu. JE sl РЕЯ ЗЕ. 
HR pH sc. 它 要 求学 生 们 通过 研究 -- 个 缓冲 区 洲 出 的 错误 ， 来 收 改 二 进 制 叮 执行 文件 
的 运行 时 行为 。 这 个 实验 教会 学 生 们 栈 的 原 时 ， 并 让 和 他们 了 解 到 写 那 种 易 十 遭受 缓冲 区 溢出 
攻击 的 代码 的 危险 性 ， 
体系 结构 实验 。 第 4 章 的 几 个 家 庭 作 业 溃 题 能 够 组 合成 一 个 实验 作业 ， 在 实验 中 ， 掌 生 们 修 
以 处 理 器 的 HCL 描述 以 增加 新 的 指令 、 收 改 分 支 预测 策略 ， 或 者 增加 或 射 除 旁 路 路 径 和 寄 
ЖАП. ИШ ЖУЗЕ ЖЕНЕ, 并 通过 运行 自动 化 测试 检测 出 大 多 数 可 能 的 错误 ， 
这 个 实验 使 学 生 们 能 体验 到 处 理 器 设计 中 令 人 激动 的 部 分 ， 而 不 需要 他 们 学 习 和 建造 用 
Verilog RA VHDL 语言 写 的 复杂 而 低级 的 模块 ， 
pin 学 生 们 必须 优化 应 用 的 核心 函数 (比如 卷 积 积分 或 矩阵 转 置 ) 的 性 能 。 这 个 实验 
韭 营 消 晰 地 才 明 了 噩 速 缓 存 的 特性 ， 并 给 学 生 们 低级 程序 优化 的 经 验 。 


| shell 实验 。 5^: 473: 804541] E] ЕРЕН ТЕМИН BILE] Unix shell 程序 , 包括 ctrl-c 和 ctri-z fg. 


fg. bg Ж! jobs tir. REFERIS R R, ЖНІМЫПЯ Unix 的 进程 控制 、 信 号 和 
fe p bB IM ТАЕ. 

malloc 实验 .学 生 们 实现 他 们 月 己 的 malloc, free 种 realloc (可 选 地 ) 版 本 。 这 个 实验 让 学 
咎 们 请 断 邮 理解 数据 的 布局 和 组 织 ， 并 且 要 求 他 们 评 佑 时间 和 空间 效率 的 各 种 权衡 和 折 中 ， 
代理 实验 ,学 生 们 实现 一 个 位 于 浏览 器 和 方 维 网 其 他 部 分 之 间 的 计 行 Web 代理 , 这 个 实验 问 
"ЛАП лу £ Web 客户 端 和 服务 器 这 样 的 问题 , 并 用 联 系 起 了 课程 中 许多 概 售 , КШ РҮ 
序 、 文 件 WO、 进 程控 制 、 和 信号、 信和 上 号 处 理 、 存 储 器 映射 、 盒 接 字 和 并 发 。 


本 书 的 教师 手册 有 对 实验 的 详细 讨论 ， 还 有 关于 下载 支持 软件 的 说 明 ， 
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促使 本 书 的 工作 得 以 开展 ， 并 有 在 Alan Fisher 领导 的 小 组 的 帮助 下 又 细 化 和 修订 了 本 站 的 二 作 。 
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МІ. James Ное 在 处 型 句 体 系 结构 方面 提出 了 很 多 有 用 的 建议 和 反馈 。 
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信息 就 是 位 + 上 下 文 

程序 被 其 他 程序 翻译 成 不 同 的 格式 

了 解 编译 系统 如 何 工 作 是 大 有 益处 的 
处 理 器 读 宕 解释 储存 在 存储 器 中 的 指令 
高 速 缓存 

形成 层次 结构 的 存储 设备 

操作 系统 管理 硬件 

利用 网 络 系统 和 其 他 系统 通信 

下 一 步 

Ма 


2 $1* 


p XL Д ph GU PERO ЖЕ ERI. КПА ТЕЖЕЛГЕН PETIT BUER RBEIBS] ELUESCTILZT 
式 随 看 时 间 不 断 变化 , ЇН Ж PI ЕР DAE МОР. РНН ВЕНН НЫН Ж PEEL E, 
TA kiya RI ВЕ. 这 本 书 是 为 这 样 一 些 程序 员 而 写 的 , ЛЫП ЕНДІ Г ЖАН PT SRI LAE 
以 及 如 何 影响 栓 序 的 蕉 确 性 和 性 能 ， 来 提 局 日 身 技能 。 

你 现在 就 要 开始 次 有 趣 的 漫游 历程 了 了。 如果 你 全 方 投身 学 习 本 书 中 的 概念 , 理解 底 屋 计算 机 
RARER EWR ARAA, EA CRR IHRE LRA RRA RRETA” PER. 

你 将 开始 学 习 一 些 实践 技巧 , 比如 可 但 避免 由 计算 机 表示 数字 方式 | 起 的 育 性 的 数 子 错误 。 你 将 
Eod cB JEDER] C RARE 6 УГ aH TERA AEH АЕ ЛТ 46 

(memory) ЖЖ. POE T RERUSSTESE EOD ARREA, ETERU AAA RARR 
Xo 6 ELE DC НЕН НО phai. ООН Ra БЕЛІ nemet КЇР Г ХАЈА. MHF 
x MV A ОТЕ ВЕНА E K TARR R 它们 困扰 着 普通 的 程序 员 , 你 将 学 会 如 何 编 号 利己 的 
Unix shell、 自 己 的 动态 存储 分 配 包 ， 甚 至 于 自己 的 Web 服务 器 ! 

TF Kernighan 和 Ritchie ХТ C 编程 语言 的 经 典 文章 [40} 中 ， 他 们 通过 图 1.1 中 所 示 的 hello Ж 
РЕЖ) ТН C. БЕ hello 程序 是 一 个 非 章 简单 的 程序 ， 但 是 为 了 完成 它 的 执行 ， 系 统 的 每 个 十 
要 组 成 部 分 都 击 鉴 协调 | 上 作 。 从 某 种 意义 上 来 说 ， 本 书 的 目的 名 是 晕 帮 助 你 了 解 当 你 在 系统 上 执行 
hello 程序 时 ， 系 统 发 生 > 什么 以 及 为 什么 会 如 此 运作 ， 

code/intro/hello.c 
d&include «stdio.h» 


1 

2. 

3 int паіп:) 
à d 

2 

b 


printfi"hello, woridin"): 


) 


code/introrhello.c 
1.1! helo 程序 


ЗА ЧЕК hello 程序 的 生命 周期 来 开始 我 们 对 系统 知识 的 学 习 ， 它 的 生命 周期 从 它 被 程序 员 
创建 开始 , 包括 在 系统 上 运行 、 输 出 简单 的 消息 ， 然 后 终止 ， 我 们 将 沿 着 这 个 程序 的 生命 周期 ， 简 要 
地 介绍 一 些 语 步 出 现 的 关键 概念 、 专 业 术 诺 和 成 分 。 后 面 的 章节 将 韦 绕 这 些 内 容 展开 。 
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我 们 的 hello 程序 的 生命 是 从 一 个 源 程 序 〈 或 者 说 源 文 忻 ) 开始 的 ， 该 源 程 序 由 三 序 员 通 过 编辑 
器 创建 并 保存 为 交 本 文件 ， 文件 名 就 是 hello.c。 源 程序 实际 上 就 是 一 个 由 0 种 1 2 84r RA E 
WO 序列 ， 这 些 位 被 组 织 成 8 个 一 组 ， 称 为 字 节 。 每 个 字 节 部 表示 程序 中 某 个 文本 字符 。 

大 部 分 的 坝 代 委 统 都 使 用 ASCI 标准 来 表示 文本 字符， 这 种 方式 实际 上 莽 是 用 MET RETO 
大 小 的 整数 值 来 表示 每 个 字符 ， 比 如 ， 图 1.2 中 给 出 了 helloc 程序 的 ASCI dg. 

hello.c 程序 是 以 字 季 序 列 的 方式 依存 在 文件 中 的 。 每 个 字 节 部 有 一 个 闽 数 值 ， 对 庶 于 某 个 字符 ， 
例如 ， 第 一 个 字 节 的 整数 值 是 35， 它 对 应 的 就 是 字符 “#”。 第 二 个 字 节 整数 什 为 105， 它 对 应 的 学 符 


m e a 


№ si" DRAE, ER АНТЕ HIORSILISRH “а” KA, Ro S tec 
910. |Ë bello.c 这 样 内 由 АЯСП ҰНЫНАН, BAIAR, 


b 1 n Ë ] ü d n x apos = s" 


E d i ü n 

5 105 110 98 108 117 100 101 32 60 115 116 100 105 111 44 
h > in iu 1 n t «вр» m a 1 n i | п | 
104 62 0 lü 108 110 116 12 109 97 105 110 єй 41 10 123 

МЮ <яр> «sp «ар» «аф» р r 1 ñ t É | h p 1 

10 ГЕ: id 12 12 112 114 105 110 116 102 40 34 104 101 108 
| я . {p0 W Ö r | а i [1 J ) wi |] 
108 111 44 32118 111 114 108 100 à 52 110 34 41 59 10 125 


ЖІ2 helo.c АЗСІ Scd ge 


hello.c 的 表示 方法 说 明了 一 个 基本 的 思想 : Жр ГЕНЕ А — ИН CHE. ИРЕ 
W. 存储 器 中 存放 的 用 户 数据 以 中 网 络 上 传递 的 数据 ， 都 是 由 一 申 比特 囊 示 的 区 分 不 同 数 据 对 象 的 
惟一 方法 是 我 们 读 到 这 些 数 据 对 象 时 的 上 下 文 ,比如 ,在 不 同 的 上 下 文中 ,同样 的 字 节 序 到 可 能 表示 
CHEN. Нық. FIERRENS. 
作为 程序 员 ， АГАЕ TCI RELIER. DORSET GE ШС ЖН]. HI 
НЫ, Т ААННЬА А АЕ. kha GE omi fcm 2 Ж SHOE, 





$t. AREE | ; à в 
СТАД ЖЕ ЖӨ) Denis Richie 于 1969 年 ~ 1973 年 间 创建 的 。 БЕ ERG 
( American National Standards Inst 





Ше, ANSI) 在 1989 4-906 T ANSI СЕЛ. deat УЗ Т C 
НАЯ, PATH CHOR. Kernighan 和 Ritchie 在 他 们 次 所 周 和 如 的 既 典 幕 必 "KAR" 
[40[Ф 467 ANSIC. 用 Ritchie HAAR, cA, “ТЕН. $i. Анд —rEXEHES. 
ЮНИ НЕ) 

* ÜÇ 5 Unix ЖЕЕ X A HS. САЯН 是 作为 一 各 用 于 Ux WG TTA AQ. 
Unix dk] АН, ПЛАЖЕ А НТ КЪАЯ СТ. хын 70 К 
ЖАН 10 MUE Me Vit МЕДИНЕ, АРЕ Р dh 
平 全 部 是 用 CHEG, CATARA aE tuj 
KAP 泛 的 支持 ， 

C 是 一 沾 小 而 简单 的 语言 C 语言 的 设计 是 由 一 个 人 而 非 一 沾 协会 掌控 的 x 
Ж RW T, ЖАНАТАН, KAR ЖЕЛТ E4650 T Jat TUE c 
ЗЕЛКА, ФЕТ 261 8. CHEM ШИЕ ЁЗ. g | 
Tl] rit к, 
. C3A435 AH HHRHH. C 是 设计 用 来 实现 Unix HE Á LA. 后 来 ， : 
ЕЕ 3 зе кып dent, 

сатаяананнжа, пке ёл танине. ка, алынат 

ТЕНТА БИДЕН. CHREAN ed BepS-dHELnEgB. н. С: & 


НАЕ Н. Sek 对象 和 和 异常。 村 时 应 用 起 程 ot Java 竺 新 的 程 话语 解决 
ЖҰМ. 



















йй 
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12 程序 被 其 他 程序 翻译 成 不 同 的 格式 


f£ hello 程序 生命 周 草 的 一 开始 时 是 一 沾 商 版 全 ЖЕ, [ИЛК РАНЕЕ. ЕЕЕ A 
WT. ӨШ. TERREN helloc БЛ, ЕСІНЕН РЕНЕ ЕЗ -RARE 
UTE ЕНУ. BEAR RRT ААРА AE Cexecutable object program) 的 格式 
ТЕН, HDC bj НИЕНІ. ELE REPRE EO TUIS Kat # (¿xecutable ahject 
Ше); 

在 Unix ЖІ, ИЗҮЕН x HEC ТЕ RE НА НА. (compiler driver) FERRI]: 

unix» gec -a hello hello.c 

(ПАШ, рос 编译 器 驱动 程序 恋 职 源 程序 立 忻 helloc. JI ЕНШЕ AAi Н Б Т hello. 


RUPEE АПАЕ ЗЕН. ШЕ 1.3 ЕТТТ WEE. 
Th S Pk) БЮТ AR. 





H3 ШЕН 

* MEERE. MERA (ср) 89У. Йй > (directives), Bev tg C 程序 。 
比如 helioe 中 第 一 行 的 #inelwde «xtdio.hcdfr НЕНІ dh t H S CE 3 PF stdio h 的 内 容 ， 

ЖЕЕ А ЕЕЕ. КИЯТ ЯС РЕ, HEDI АЖЕН ШШ 

Ж. 

* ЖЕН. ЖН (сі) ECT PE hello ШЕТ ЖИ heba, ТШ С 
Ж. ИСЕРЕК НШІ -ВБИЕМТАЕР tinh Bip T ЕПИ АЕН 
+. ПАН ДЕЗЕ ИШ. BLS ЧЖЕН АГ На ЕК ТИ 语言 。 
例如 ，C I HERERI Fortran 蝙 译 器 产生 的 输出 立 忻 用 的 前 是 TERTIL NIB ET. 

е ЮНИ. RETO. 汇编 器 (as) 将 hello ЕШ ТІҢ, fri iem gx 
MATE EE (relocatable) Н dt (Met. КИН НЕН ЕН hello б. helloa 
ЕНЕ-жсинтір ЄТ ЕТИШДИ ШАН Rim. MERT ЧТ ү 
ӨТТ оо X fF, ERES НЕЯ F. 

" МИКИ. WIDE. RIT bello 程序 调用 了 міні 函数 ， 它 是 标准 CERE EN. N 
T C КЕННЕ. pi ARET- AEA ріміз ПЕШІНЕН ЕЕ, kd 
误 件 必须 以 某 种 方式 并 六 到 我 们 的 hello.o НС, ЕЕЕ Od) а ЖАНЕ А. Hm 
ЖҮЙ hello СФЕ, E48 — PST AUI RE He CHERENERE UT LE Ж), 可 TEE Е 
frm. mm NKU. 


ышт 2 


LU | i 
l—— Г ГттЙЙҮ‚[Ъь 


F: GNU 项 目 + —" 

ОСС Ж GNU ( GNU Ж GNU's Not Unix 95) WAPA ФН ДИТ ONU 
Ж 1984 年 由 Richard Stallman Ж Ж Н MEER, OR BERGER KL REFE —4- 
完整 的 大 Unix £j Ks. када жп bka e P 2002 4, GNU EEEN £ ҮА 
3j — Unix ## Ë 8.66 + Santu) K i tak, АНЕ, АҢ Жш Linux € R koa ç R кё 
Ki. GNU SJE 845 EMACS ЊЕ. GCC ШЕЕ. GDB ЯКЕ. TE. HER, AD Seo 
的 工具 以 及 其 他 一 些 部 性 ， 

GNU 项 目 取得 了 非 儿 的 虐 铺 ， 但 是 却 常 带 被 起 略 ， 现 代 开 堵 源 码 迁 动 (AFF Linux ТИ 
起 ) 的 思想 起 源 是 GNU 项 目 中 自由 软件 (free software )8 84e. [d HI free 为 自由 言论 [ free speech ) 
PT AE EE, TELERA (fre beer】 Ф-ЖҒ ЕЖ ] SE, Lim Fe £E ERAR E 
EBY ОМО r R, Eii Limux ART ——— 
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ЗЕ епос ЕРЕЖЕ, ЫТЫМ КЕЛЕ ЖЕНЕШЕ LII 但 是 ， 有 一 
ЖЕТЕ ИДЕ SIE P Ue S s eR НЕ Ж ЖЕЕ ШИ THEN. 

* КАРАЙ. ТОРМА, ЖАМЫЛҒЫНЫҢ, AREA, mi 
E308 T S HA ЕЕ ТЕТЕ. НЕ. АГАН C ЕГІН 
代码 选择 , 我 们 确实 需要 对 iL йн а UL SRI n f ЖН C 语句 转化 为 拒 蝙 语言 有 一 些 
ЖЖ T W. 比如 ,一 个 switch tJ B RR ü E. |£ — RAN if-then-else Ж? 一 个 
НЕИН 3 K? while MEHE АНЕ ЕН? Led Ies bc DIETE DUM: 
*LT HIR IL 4| FE S WS ЖЕКИ, А HE OR RO ИЕ. War cest 
W? ЖАГАР AP mhil BUE ЕД КЕШЕ ШЕНІНЕН? 

ERIP, ЖҮЗІНЕ Intel lAN HUBER S. КЕНЕН ЖАҢ C 程序 站 
EIE HC LE EA. FEES Жр, pepe s anii eb С ЕНШЕ іе, mg 
ЖАГ ДАЛЕЕ L, АНИФЕЫСЕЛЕНЕ, Ж ЕТЕЙ S G. Hen da S fF fk baik: 
ҮН, Cim ERI inu ШЕШЕН, DLE С ЁРЕ ЖШШЕ ДЕНІҢ i ae e цр 
БИЙГЕ reed fr. 

e ERER ERKKI ят, Hd 4e А. DRE TRE FERE СЕ TS EHE IE 
HX, LEGE MEBUBM КЕПКЕН. Him, 链接 条 报告 说 它 无 法 解析 一 个 引用 ， 
BETLAR? БЕТЕН ЕЧЕИ BR? 如 困 你 在 不 同 的 C Бірі ТҰ? 
相同 的 丙 个 全 局 变量 会 恬 生 什么 ? БЕНЕН ШІ ЕЕ A? AH A RACE ІТ E 
地 列 库 的 顺序 是 有 影响 的 ? 最 为 烦人 的 是 ， 为 什么 有 些 链接 错误 直到 运行 时 才 出 现 ? ZW - 
章 中 ， 你 将 了 解 到 这 些 问题 的 答案 ， 

" BCETG.IqTE ИЖИ diit T Jc d R Intemer LES Nw ен [IP 
ЕНН АСТЕ Е CR ЖЕГЕ Т ШИ TR REB а Ч tin КЕЗЕНДЕ, 作为 学 
АЕ БЕТЕР 


ñ # 1 章 


14 АЗЕ ЕЛИНИ ТЕТЕ Н Н АБ 2 

ЖЖ. 我 们 的 hello.c ЕРЕ Ёш ЖКН Т ПТ Н deci ik hello, kirik ram E. 
A TE Unix ЖК та а ИТ, RRÁ TEPEE ELCHE 549 АЯ shell 的 占用 程序 中 

unix» ./fhello 

hello, world 

unix» 

shell ВТЕ, Td — ER. HH А I 3, Muri Йй p. m 
Rim piri а А 7 Әр W BJ shell r$, ДЕА, shell Aen Е TREAT CIEL E 
ЖННДГ. АСТЕ ЈМ ЧР, shell 将 加 载 和 执行 hello ЕР, BESHTA. hello 程序 
II WL WH WS. MESE. тел 站 后 输出 一 个 提示 符 ， 等 待 下 一 个 输 六 的 市 令 行 ， 


1.4.1 系统 的 硬件 组 成 

HT TREH hello RHET TER. 我们 雷 要 理解 一 个 奥 型 系统 的 硬 忻 租 识 ， 如 图 La 所 示 。 
ШӘКЕН Inte] Pentium Kx ndm AES. ЧАЛАТ Е ЕН ЕТЕ. 现在 不 要 担心 
iK RH e -ИЗНЕНРАА ИШЕ A BE fe КЕНІ. 









=s | | á 


Гим. НЕЕ 
ЖЕ de (ЕН 


可 执行 支 件 
Шіл НОТЕ Е 
CPU; TRENE: ALU: ИРИ x. PCS ВЕЕ, USB. ЕНА, 
аң 
ТИ ТИИ, КЕЗЕ, ТАНЕ Е ips TERES. AR EH 
Wü me ЕТІН, B (wo). Tames (W$ ROU KAKEK. 5 


计算 机 系统 漫游 7 


个 系统 中 也 不 尽 相 同 。 比 类，Intel Pentium 系统 的 字 长 为 4 字 节 , 而 服务 器 类 的 系统 , 例如 Intel Itaniums 
iH) Sun 公司 的 SPARCS 的 字 长 为 8 字 节 。 用 于 汽车 和 工业 中 的 柑 入 式 控 制 器 之 类 轻 小 的 系统 的 
字 长 往往 只 有 1 或 2 字 节 。 为 了 便于 描述 ， 我 们 很 设 字 芍 为 4 字 节 ， 并 且 假 设 总 线 一 人 次 只 传 1 F. 


VO 设备 

UO (输入 /输出 } 设备 是 系统 与 外 界 的 联系 通道 。 我 们 的 示例 系统 包括 四 个 TO 设备 ， 作 为 用 户 
输入 的 键盘 和 眼 标 ,作为 用 户 输出 的 显示 器 ， 以 及 用 于 长 期 存 情 数据 和 程序 的 磋 扒 骤 动 器 (简单 地 说 
就 是 磁盘 )。 最 开始 ， 可 执行 程序 hello 就 放 在 磁盘 上 。 

每 个 IO 设备 都 是 通过 一 个 控制 器 或 适配器 与 UO 总线 连接 起 来 的 。 控 制 器 和 适配器 之 间 的 区 划 
主要 在于 它们 的 组 成 方式 ,控制 器 是 IO ВА ЖЯ ФА АНУ ЕА ЕА ОТАМ) 上 
的 芯片 组 ， 荀 适配器 则 是 一 块 播 在 主板 播 档 上 的 卡 。 无 论 如 何 ， 它 们 的 功能 都 是 在 VO 总 线 和 UO 设 
备 之 间 传 递 信息 。 

第 6 章 会 更 多 也 说 明 磁 盘 之 类 的 TO 设备 是 如 何 工作 的 。 在 第 il 章 中 ， 你 将 学 习 媳 何在 应 用 程 
序 中 利用 Unx VO 上 接口 访问 设备 。 我 们 龙 其 关注 特别 有 趣 的 网 络 类 设备 ， 不 过 这 些 技 术 也 适用 于 其 
他 设备 。 

ЖЖ 

主 存 是 一 个 临时 存储 设备 , ЕЖЕЛДЕН, ЕЛЖАН ЯН ТАН Н ДЕ. 物理 上 
来 说 ， 主 存 是 由 一 组 DRAM (动态 随机 存 取 存储 器 ) 芯片 组 成 的 ， 轴 辑 上 来 说 ， 存 情 器 是 由 一 个 线 
性 的 宝 节 数组 组 成 的 ， 每 个 字 节 都 有 自己 惟一 的 地 址 《数组 索引 )， 这 些 地 址 是 从 堆 开 始 的 。 一 般 来 
说 ， 组 成 程序 的 每 条 机 器 指令 都 由 不 定量 的 字 节 构 成 ， 与 C 程序 变量 相对 应 的 数据 项 的 大 小 是 根据 
类 型 变化 的 。 比 如 ， 在 运行 Linux 的 Intel 机 器 上 ，short 类 型 的 数据 需要 2 字 节 ，int、float 和 long 类 
型 则 需要 4 字 节 ， 而 double 类 型 需要 8 字 节 。 

第 5 章 具 体 说 明 存 赃 技 术 , 比如 DRAM 是 如 和 何 工作 的 ,以 及 它们 又 是 如 何 组 合 起 来 构成 主 存 的 。 


Mr. 

中 央 处 理 单元 《CPU) 简称 处 理 器 ， 是 解释 〈 或 执行 ) 人 存 情 在 主 存 中 的 令 的 引擎 ， 处 理 器 的 核心 
Е “ЖЖЖЖ ЛЖ (РС) 的 字 长 大 小 的 存储 设备 【或 寄存 器 )。 在 任何 一 个 时 间 点 上 ，PC 都 
指 回 主 相 中 的 某 条 机 器 语言 指令 《内 含 其 地 址 )。 

从 系统 通电 开始 ， 真 到 系统 断 电 ， 处 理 器 一 直 在 不 假 思索 地 重复 执行 相同 的 基本 任务 ， 从 程序 计 
Жаз (PC) 指 问 的 仓储 器 处 读 取 指令 ， 解 释 指令 中 的 位 ， 执 行 指令 指示 的 简单 操作 ， 然 后 更 新 程序 
计数 器 指向 下 一 条 指令 ， 而 这 条 指令 并 不 一 定 在 存 情 器 中 和 刚刚 执行 的 指令 相 邻 。 

这 样 的 简单 操作 的 数目 并 不 多 ， 它 们 在 主 存 、 寡 存 器 文件 (register file? 和 算术 还 辑 单 元 (ALU) 
之 加 循环 。 寄存 器 文件 是 一 个 小 的 存储 设备 ， 由 一 些 字 长 大 小 的 寄存 器 组 成 ,这 些 寄 存 器 每 个 都 有 惟 
一 的 名 字 。ALU 计算 新 的 数据 和 地 扯 值 。 下 面 是 一 些 简 单 操作 的 例子 ，CPU 在 指令 的 要 求 下 可 能 会 
执行 这 些 操作 ， 

. 加 载 ! 从 主 存 找 抽 一 个 字 节 或 者 一 个 字 到 寄存 器 ， 覆 盖 寄 存 器 原来 的 内 容 。 

e 存 全 ， 从 寄存 器 拷贝 一 个 字 节 或 者 -个 字 到 主 存 的 某 个 位 置 ， 覆 盖 这 个 位 置 上 原来 的 内 容 。 


1 РС 也 普 包 地 磋 用 来 作为 个 人 计算 机 的 缩写 。 热 出， 两 者 之 间 的 区 别 度 该 可 以 很 清楚 地 从 上 下 详 中 看 出 来 ， 
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ЕИ. 接 贝 两 个 寄存 器 的 内 容 到 ALU，ALU Hr Tr. PEARa 1 EP, 
Wk dc fem pom de. 
* pod. M~t ORA PRETI- tE TRK- 80] — е ТЕЕ, 
" lox. 从 一 个 要 存 器 中 拷贝 一 个 字 节 或 者 一 个 宇和 到 一 个 DOGS. 
€ ЯН MR EG ERAF, PRAA TERRAS (РС) th, B PC 中 原来 
ЖИН. 
5 4 Suns REB ТЕШ ЖЕ ЕШ ik: d. 
142 执行 hello 程序 
81d M AST АНЕ {ЕЕЕ Ж ЕН. ИІН ТИДЛАН ЕНИН ЕК ЕТ 
%. АН ТЕПЕ ИНН ЕШЮ, ШИИ ЖҮКЕ. CERRAR ТЕН. 
ИЖ. shell 程序 执行 它 的 指令 ， 等 竺 我 们 输入 命 伺 。 当 我 们 在 键盘 上 屿 入 字符 申 “hello Б. 
shell ЕРЕ СЕРР, MECRA h. ШІ 1.5 所 示 。 
CPU 





ЕНЕҢ 













WR. шыл 


— —71 R B— ЖШ ФЕ 
Bu pps 
ра 


围 1.5 Aus rig hello d$ 
| SAN КЕНЕН, sen dE RETE e Im A. M shell Т НК 
T. АШ hello Eig Fih i El КЕДЕН RICE AE, MEO bello Tit. ЖЫ 
Pre lE THER TERR. “hello, world". 
| PHRA DMA СИКШИ. ТЕА е ЕГ) ШЖ. Nga ELDER AE i ЕЕ 
Wa S REG. РЕШШ LNT. 
—H hello НЕКЕ at fea do Е ТЕН T trik, 处 理 器 就 开始 执行 hello 程序 的 主 程序 中 





TAL GER _ g 


LL fü. BEA "hello, worlda” 申 中 的 字 世 从 存储 器 中 乒 册 到 寄存 器 文件 ， 再 从 寄存 
贱 中 文件 皇 贝 到 显示 设备 ， 最 崇 显 示 在 屏 莫 上 。 这 个 步 独 如 图 1.7 所 示 。 











Мы 


BE] mui 8 


THEM. NH ыш 


Us m такта Aras 
mt "m. TI NM 


E 丰 册 在 磁盘 上 的 mlo 


12 从 融 盘 加 瞄 可 执行 误 件 到 主 存 





| YA, түн 
ua |КЕ Angie 
кин 


USB | 
ENEO 


Ек (ті Ет — 5 
| Р — WH EE hello 
“halla, warkdln | ча ШАБУ 


1.7 HMM BNET 


15 ЕВ 
iron e pe pRHOT WPJ — i, SUR scm TAREHA AAA ЕНІ 


10 ЖЕ: = 

到 另 一 个 地 方 ，helln ЕЛЕНЕ SIME FK EI БЇ. ӘНЕ, CTER IAEF. 
АИ ЕТТИ НЕН. БӘЛАЕНЕЛЕНЕ. HHDH КЖ “hello, тоғШа” FE ERA 
b, НЕ EFE, ЖЕЛЕ {Т З ЖЕ. K ЧЕСТ АННЕ ЕГ. KERS ДАТЕ Г 
КЕНДЕ LE. ЯН, ЕК ЕЙ T FE HERE TER ШЕ oT REHSTR . 

Mia. mm. КЕКИ ЕЕН ЕЛГЕ ЕТИШ. ТИВ vae Bod rod T EG [Е] 
Gum. mig. —T AES Lm qa ПЕН. ЕЗ K 0018. ІНЕН, ЕШШ 
9 rum Temm fl TRAE EM E femi mU 1000 ЛІ, 

жын, — T AES S PHI LE TWB, biis. EXrSHfémULBT M. 
Wn. ЖИЫ, ЖЕ Kirit U К+ АЕ gh Л. 10018. БЕЛІНЕ, MON D sip FE SE 
Bak kdi. IRL E += s] 6) E ИЧЕННЕ. ПРИН Bine TRE EE E ЕТІНЕ 
а НИ mE. 

ПАДЕК ЕЕ ЕНЕ. ЖЕ # ЖН ТЕЛЕ ЕЙ R h. ЖЕҢ АЕ ЧЄ А AE 
Е (cache memories, ПЕЙ», ТЕПН ЖЕ ЕТЕДО. {ГЕЛЕН GET 0 EJ Ou] 
SAJNA. MLETI ЕВЛЕНФТФИМ Ж TR 3. ЕРО R LI LI ЖЕН 
НГЕ SES, Ur sk TL IS Fd w Wik. РНЕ Ж-ДИ H 0 
W Ki L? AtA EA- ЖАНА R. 进程 访问 L2 ИМІПШНЕШЕНІЗЕГІЛ 的 
ЖАЙ; sd. {ЖЕНЕН ЕТЕНЕ 5--10 ff. LIA LI Ж ERI PU ДЕ ИЛЕ 
ИЫ (SRAMI ТИЙ {ЄК ЖЕШ). 

ik x 45d EUN 2 — ЖЕНЕ РЕШЕ И W ЗЕЙ {ҮҮТ ЖЕНЕ, ШЕРИ ДЇ IPE HRK 
HEARRE. MER o EEF HASERA. TB ЕЛІ. 


CPU IA 





LB ЖЕКИ 


1.5 形成 层次 结构 的 存储 设备 


IAEA PAQ AC COG ERO ZB TE. БЕРЕН Сш. жш 
АЕ) 的 屯 法 成 为 一 个 普遍 的 观 壤 ， 实 际 上 ， 短 个 计算 机 系 续 中 的 存储 设备 帮 蕉 粗 识 成 一 个 季 
WEE. ЖЇН LO ЕСЕР. FR TERAN, AES FS HAERE WX. 
И A pas pde E Ric. РТР ЕЕ ОН ЕТІН, (ECCE ОША LO. 11 fk 
mrt RW — E (MEURA LI. L2 SEINT AEN THE. ETERNE. ПЧ. 

tle ir E SB R TEX ЕВА Е РЕ у Е Да ЕНЕН ИНН. ТЫН. 
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寄存 器 文件 就 是 Ll 的 高 速 缓存 ， 而 Ll 又 是 L2 МЕН, L2dEXdRU ИР, +h NS 
高 速 缀 存 。 在 某 些 带 分 布 式 文件 系统 的 网 络 系统 中 , 本 地 磁盘 就 是 其 他 系统 中 磁盘 上 -被 存储 数据 的 高 
ERF 










更 快 Біз 
FE) 存 情 器 的 字 

Ж Zmena, (SRAM) ЫННЫҢ L2 Ий 
n /Ny 

| Tf (SRAM) г ARR GARAI 
ү 
主 存 储 器 
大 (DRAM? Есте 
A T EY 


本 地 磁盘 保存 取 自 远程 网 络 


图 1.? 一 个 存储 器 层次 模型 的 示例 


就 像 程序 员 可 以 运用 Ll 和 L? 的 知识 来 提高 程序 性 能 一 样 ， 程 序 员 间 样 可 以 利用 对 整个 存 贱 器 
层次 模型 的 理解 来 提高 程序 性 能 。 第 6 章 将 更 详细 地 讨论 这 个 问题 。 


17 操作 系统 管理 硬件 


让 我 们 回 到 hello 程序 的 销 子 . 当 shell 加 载 和 运行 hello 程序 时 , 当 hello 程序 输出 自己 的 消息 时 ， 
程序 没有 直接 访问 键盘 、 ЕТЕ НЫН ЖЫ 取而代之 的 是 , 它们 依靠 操作 系统 提供 的 服务 。 
我 们 可 以 把 操作 系统 看 成 是 应 用 程序 和 硬件 之 间 插 入 的 一 层 软 件 ， 如 图 1.10 所 示 。 所 有 应 用 程序 对 
硬件 的 操作 堂 试 都 必须 通过 操作 系统 。 





110 计算 机 系统 的 分 层 视 图 


操作 系统 有 两 个 基本 功能 : 防止 硬件 被 失控 的 应 用 程序 洪 用 ; 在 控制 复杂 而 又 通常 广泛 不 同 的 低 
级 便 件 设备 方面 ， 为 应 用 程序 提供 简单 一 至 的 方法 。 操 作 系统 通过 图 1.11 中 显示 的 凡 沾 基本 的 抽象 
W GER., ARAS XE) 实现 这 两 个 功能 。 如 图 1.11 所 示 ， 文 件 是 对 UO 设备 的 抽象 表示 ， 
BERLERE a ЕЯНЫН VO 设备 的 抽象 表示 ， 进 程 则 是 对 处 理 器 、 主 存 和 JJO 设备 的 抽象 表 示 。 
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17.1 进程 

IË hello LEER] REPE TERLC AE КЕШТИ. АЕ ВЕЕ р, ШЕ ЕШ Hik SS 
HER. RES D БАКАН. „ШО £, ПЕЙ Ж L ЖЕЕ [ШЕШ Hb — «ed 
ЖНА PH+. ТЕРНЕР Е ЕТИ 
ЗЕРЕН ЖЕН. ИЕЕИИПЕРФИЯЕНИНЛІЫҢ — 

dE ЕВЕ ЖЕТПЕ bti. Е—1®# En DL ЕЕН ЖИНИ, HERE M 
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像 在 独占 地 使 用 硬件 , 我 们 称 之 为 并 发 运行 , 实际 上 是 说 一 个 进程 的 指令 和 另 一 个 进程 的 指令 是 交错 
执行 曲 。 操 作 系 统 实现 这 种 交错 执行 的 机 制 称 为 上 下 葡 切 措 (context switching). 

操作 系统 保 存 进程 运行 所 需 的 所 有 状态 信息 。 这 种 状态 ， 世 就 是 上 下 文 (eontext)， 包 插 许 多 信 
E. Hn PC 和 寄存 器 交 件 的 当前 值 ， 以 及 主 存 的 内 容 。 在 任何 一 个 时 刻 ， 系 统 上 痢 内 有 一 个 进程 正 
在 运行 , 当 抠 作 系 统 决定 从 当前 进程 转移 控制 权 到 某 个 新 进程 时 ， 它 就 会 进行 上 下 文 切换 ， 即 保 仔 当 
前 进程 的 上 下 文 . 恢复 新 进程 的 上 下 文 ， 然 后 将 控制 权 转 移 到 新 进程 。 新 进程 就 会 从 它 上 次 停止 的 地 
Jj 98. PH 1.12 展示 了 我 们 的 示 鲍 bello 运行 的 基本 场景 。 

在 我 们 的 示例 场景 中 有 两 个 同时 运行 的 进程 ，shetl 进程 和 bhello HR. 最 开始 ， 只 有 shell 进程 在 
运行 ， 等 待命 令 行 上 的 输入 。 当 我 们 让 它 运 行 hello 程序 时 ，shell 通过 调用 一 个 专门 的 函数 ， 即 系统 
调用 ， 来 执行 我 们 的 请 求 ， 系 统 调 用 会 将 控制 权 传 递 给 操作 系统 。 操 作 系 统 保 存 shell 进程 的 上 下 文 ， 
创建 一 个 新 的 hello 进程 及 其 上 下 文 ， 然 后 将 控制 权 传 给 新 的 hello 进程 。 在 hello 进程 终止 后 ， 操 作 
系统 恢复 shell 进程 的 上 下 文 ， 并 将 控制 权 传 回答 它 ， 它 会 继续 等 符 下 一 命令 行 输入 。 


на 0 BO | XP 
: 应 用 程序 代码 | 
ШЕ ИНИН) 上下文 切换 
| 点 用 程序 代码 
ШЕР » 操作 系统 代码 Ет 
| 应 用 程序 代码 S 


图 1.12 进程 的 上 下 文 切换 


实现 进程 这 个 抽象 概念 需要 低级 硬件 和 操作 和 又 统 软 件 的 紧密 合作 ,我 们 将 在 第 8 童 中 揭示 这 是 如 
何 工作 的 ， 以 及 应 用 程 译 是 如 何 创建 和 拧 制 它们 的 进程 的 。 

进程 这 个 抽象 概念 还 暗示 着 由 于 不 同 的 进程 交错 执行 , 打 乱 了 时 间 的 概念 , 使 得 程序 员 很 难 获 得 
运行 时 间 的 准确 和 可 重复 嗣 量 , 第 9 章 讨论 了 现代 系统 中 的 各 种 时 间 概 念 , 并 描述 了 用 来 获得 准确 浏 
量 值 的 技术 ， 


17.2 线程 

尽管 通常 我 们 认为 一 个 进程 只 有 单一 的 控制 流 , 但 是 在 现代 系统 中 ,一 个 进程 实际 上 可 以 由 名 个 
称 为 线程 的 执行 单元 组 成 ,每 个 线程 都 运行 在 进程 的 上 下 文中 ， 并 共享 同样 的 代码 和 全 局 数据 。 由 于 
网 络 服务 器 中 对 并 行 处 理 的 要 求 ， 线程 成 为 越 来 越 重要 的 编程 模型 ， 因为 多 线程 之 间 比 多 进程 之 间 更 


容易 共享 数据 ， 也 因为 线程 一 般 都 比 进程 更 高 效 。 在 第 13 章 中 ， 你 将 学 习 到 并 行 的 基本 概念 ， 也 包 


173 虚拟 存储 器 

上 吕 拟 存储 器 是 一 个 抽象 概念 , 它 为 每 个 进程 提供 了 一 个 人 很 象 , 好 像 每 个 进程 都 在 独占 地 使 用 主 存 。 
每 个 进程 看 到 的 存 依 器 都 是 一 致 的 ， 称 之 为 虚 拉 地址 空间 。 图 1.13 所 示 的 是 Linux 进程 的 虚拟 地 址 
空间 《其 他 Unix 系统 的 设计 也 与 此 类 似 }。 在 Linux 中 ， 最 上 面 的 四 分 之 一 的 地 址 空间 是 预 留 给 操作 
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系统 中 的 代码 和 数据 的 , 这 对 所 有 进程 者 一样, КОШУ РОНА ЦЕ ЕНИ ЖЛЕ Н ДЕКА XCTI 
代码 和 上 数据。 请 注意 ， 转 中 的 地 址 是 从 下 往 上 增 坟 的 。 


ОТЕ Е — РЕЖА 


Охе о000000 | ЗЕ 


printfi BK 


üx4AU O7 2000 


к Irma xir 





` | Ж hello s Br 


оховоавооо ЕЕС р 
Nc a 
81.13. H RE i b gr 2 f 
tT ue PETERE] li HE s ШЕН ACCES XX) (аға) Ry. ЕТІКШІ IFIDINE. DE 
Bf m Pede А ЕН x e vid, {НЕЕ HERES S. МЕКИ. ЖЫ 
НР ЕЧЕИ SHE. 

н Е, Tek А — АН. ЖЕЖШБЕКС ЕЛЕНІЛІШІЕІНІЗ. 
{кшн р Жн ЗАТ НЕЕЕНЕНЕНЕНІ, FERRE TESTE ih ДЕ T UT ЕР hello, dE 
ТАТЕ НЛО АТ, W SB E Н X ub ze [sj hik E HATTE. 

е Ж. ТЕС ЕГО ci. КЕНШІ ЖЕШИН — В {нит БЕЛІНЕ 
TAE. НЕЖЕ, ЖЫН malloc 和 free 这 样 的 C Ex PENES E. Eu] ELE 
行 时 动 志 把 扩 ШИЙ. dem 10 ЕЗШШ НЫН. ЖЕ TERTIBSSIPRCIEE 

. ЖА, ERE SIE e) (8 ЗА -ЕНЕНКЕС ЕЕ И BLUE HET HAE E ЖАН 
Em. 共享 库 的 概 才 非常 强 太 ， НАНА ТИЧЕ. EX 了 章 我 们 学 习 动 态 锁 
ЖЕН, ЖТА ЕКЕНІН TIERS. 

. 8. ИҮТИРЕННІЕРІҢ ТЕТЕ ER] A НЕТЕТ ЕСМ РА ТА. RUE FF. 用户 
ҮННЕН ЕНІ, РЕНА, RIAH TAN, НЕШЕ. 
ВЕТ БОБ. Кен, SEV 3 ACpPERREES RE RR ЖЕ PRI, 

€ ARAKERE. ЖЕ ИН ЖЫ ЖИ ШЕТИН. ҢЕШТИН И ШЧ — RESTE 
ЖАНЕТ. АСА РЕА РЕ ТАЕ MUT ЕЙ ЖОНИ A Be PCS X FRE. 

Bia fh die ERE PER MERE Hc PCR fa] PA] BOISE u PP] qe. 和 包括 对 处 理 品 生成 的 每 个 

ЖИ НЕЧИН. КЕШПЕК-УЗЕНШІГШЕНЕН НИНЕН L. MIS RICE ETE АШЫ 
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ЖАТ. ЭЖЕШ LE, PLK БТ ААД AR BEDS (1 0C Ж. 


1.74 文件 

KH APPA T4. BRBRUOGES. ЖОҒЫН. SS. кут. FOP TS, ШІ 
看 成 是 文件 ,系统 中 的 所 有 输入 输出 前 是 通过 使 用 称 为 Unix UO 的 7B LR E ИПИНЕ ЕЖ 

立 件 这 个 简单 而 粳 敏 的 概念 是 非常 蝇 太 的 ,因为 它 使 得 应 用 程 守 能 踪 统 一 地 看 入 系统 中 可 能 富有 
BUR AERE DO vedi. BERT, AERA CHEST Е В Da REEL TES SENSU Je T RE nR 
ERRA. XE. ЕНІП АЛЕН ASI RES RORIS IRIS ERE ЗЕ. ЖЕ 11 章 中 学 
5} Unix VO, 

S. Linux BE 

1991 年 8 月 ， 一 个 名 为 Linus Torvalds ААЖ T —Л- th Ж Unix КЖ X 8, 
Ж. 

Ж. Й: torvalds@klaava.Helsinki.FI (Linus Benedict Torvalds} 

新 闻 组 : comp.os.minix 

ЖА. 在 minix P RRRA HHA? 

岳 要 ;关于 我 的 新 操作 系统 的 小 调查 

时间: 1991 4-8 H 25 B. 20:57:08 GMT 

每 个 使 用 minix 的 朋友 ， 悚 们 好 – 

我 正在 向 -一 个 【免费 的 ) 用 在 386 (456) AT 上 的 揉 作 系统 【只 是 业余 爱好 ， 它 不 会 像 GNU Я 
样 处 大 和 专业 】, 这 个 想法 自从 4 ARER HER, АБН minix 喜欢 和 不 满 的 反 情 意见 ， 
汉 为 我 的 揉 作 系统 在 某 些 方面 是 模仿 它 的 [ 其 中 包括 相间 舶 文件 系统 的 物理 设计 (因为 茶 些 实 烽 的 碌 
R )], 

我 现在 已 经 移植 了 bash (108) 和 gcc (1.40)， 并 且 看 上 去 能 运行 ， 这 意味 着 我 需要 几 个 月 的 时 
间 来 让 它 变 往 更 实用 一 些 ， А, A Eod X EUR ME, ЖӘНМЯН яла ЖЕНЕ 
我 能 实现 他 们 ，: - ) 

Linus (torvalds &kruuna.helsinki fi) 

EFRI, Ө ПИЙ, MUROS T Ж. Linux 逐渐 发 展 成 为 一 个 技术 和 文化 现 条 , 道 过 和 GNU 
项 目的 力量 结合 ，Linux 项 目 发 形成 为 了 一 个 完整 的 、 特 合 Posix 标准 的 Unix МЕКИ НА, ее 
内 被 和 所 有 支撑 的 基础 设施 。 从 手持 设备 到 大 型 计算 机 ，Linux 在 范围 如 此 广泛 的 计算 机 上 衬 到 了 应 
M. ІВМ 的 一 个 工作 组 甚至 把 Linux 移植 到 了 一 块 手表 中 1 


1.8 利用 网 络 系统 和 其 他 系统 通信 


系统 漫游 行 之 至 此 ， 我 们 一 育 是 把 系统 视 为 - -个 孤立 的 硬件 和 软件 的 集合 体 。 实 际 上 ， 现代 系统 
竹 仙 乓 通过 网 络 和 其 他 系统 连接 到 - -起 的 。 从 -个 单独 的 系统 来 看 ， 网 络 可 被 视 为 又 -个 IO 设备 ， 
如 图 1.14 及 未 。 当 系统 从 士 存 措 贝 一 串 季 符 到 网 络 适 配 回 时 ， 数 据 流 经 过 网 络 到 达 男 一 - 台 机 器 ， 市 
不 下 到 达 本 地 磁盘 驱动 器 。 相 伏地 ， 系 统 可 以 读 取 从 其 他 机 器 发 送 来 的 数据 ， 并 把 数据 拷 册 到 自己 的 





и | кола aikan) meen 


W эй ита = m" | 


1.1 网络 也 是 一 种 DO 设备 

БЕЗИНЕ Internet 这 样 的 全 球 网 络 的 出 现 ， 从 一 浊 主 机 插 贝 信息 到 另外 一 音 主 机 已 既成 肖 计 生机 标 
HEEE —, БЕШ. ЕНТІГЕ. UDHARA. JUNE. БІРІ telnet 这 样 的 应 用 都 是 基 
FETARE IAME. 

回 到 我 们 的 hello 4:58, AIT GETAG elia 应 用 在 一 个 远程 让 机 上 运行 hello ИР, pit 
ЖИИ ЖЕ ЕЩ Ей telne ЖЕ ЕЕ ЕН ЕМ telnec НЕН, ЕЕПӘЖНШЕ ЕНІНЕН shell 
后 ， 运 端的 shell AEREN AA e. DARA EXE. INGET bello ЕНШІ 1.15 К 
ЖЕН ЕЗІН, 

I, R| ub E 


ЖХ. "hallo" 7 КІШІ кін НЕЗ 
ес, ятты” | Ж, 3, ERER hal RR 
—— У abun \ “МӘ bello". de 
ЖАШ у BH infr ме МЕИ 
араанын | wj Io ES tela 服务 器 


— 4 Telna B B I Rà 


5. PE E В L3T ETA “bajo wila" 


HI "hello worldin" 


81.15 HA tene ИЙНИНЕ helo 
ЧАТ 3 P* 38108 А hello “ii ЖЕ КЕШІНЕ, K AOP iX АСЕТ ЖЗ Н] telnet 
的 服务 器 。 在 telnet ПЕ ЕА FEM K TRE. КЕЕ ЖЕШ shell ЙЕ. ЖЕЖ. ind 
shell 运行 hello ҰС, ЖӨН Н ГЗ Н telnet |Н, ШЕ, lna RAELA PHIL h$ Ы 
ielner Ж", ve P E pe d ІП ЖАНЕ L. 
这 种 在 客户 端 和 轩 务 器 之 间 变 互 的 类 型 在 所 有 的 网 络 虚 用 中 是 非常 典型 的 。 在 第 12 章 中 ， 称 特 
学 会 和 如何 构 造 网 北 应 用 程序 ， 并 利用 这 些 知识 创建 一 个 简单 的 Web 服务 器 。 
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19 下 一 步 


我 们 旋风 式 的 系统 漫游 到 此 就 结束 了 。 从 这 次 讨论 中 要 得 出 一 个 很 重要 的 观点 , 那 就 是 系统 不 仅 
仅 只 是 硬件 。 系统 是 豆 相 交织 的 硬件 和 系统 软件 的 集合 体 , 它们 必须 共同 协作 以 达到 运行 应 用 程序 的 
最 终日 的 ， 本 书 的 余下 部 分 将 对 这 人 论点 进行 展开 。 


110 :; ^ 


计算 机 系统 是 由 硬件 和 系统 软件 组 成 的 , 它们 共同 协作 以 运行 应 用 程序 。 计算 机 内 部 的 信息 被 表 
RA -组 组 的 位 ， 它 们 依据 厅 同 的 上 下 文 又 有 不 同 的 解释 方式 。 程 序 被 其 他 程序 翻译 成 不 同 的 形式 ， 
开始 时 是 ASCI 文本 ,然后 被 编 详 器 和 链接 器 翻译 成 二 进 制 可 执行 文 肖 。 

处 理 器 读 取 并 解释 存放 在 主 存 严 的 二 进 制 指令 。 因 为 计算 机 花费 了 六 量 的 时 间 在 人 存储 器 、LO iW 
WI CPU 寄存 器 之 间 找 由 数据 ， 所 以 系统 中 的 存储 设备 就 被 校 层次 排列 ，CPU АМЕН, BOE 
是 多 层 的 硬件 高 速 缓存 存储 器 ，DRAM 主 存储 器 和 袜 盘 存储 器 。 在 层次 模型 中 位 于 更 高 层 的 存储 设 
备 比 低层 的 存储 设备 要 快 ， 单 位 比特 造价 也 更 向 ,程序 员 通 过 理解 和 运用 这 种 存储 层次 结构 的 知识 ， 
可 以 优化 他 们 C 程序 的 性 能 。 

操作 系统 内 核 是 应 用 程序 和 硬件 之 间 的 媒介 。 它 提供 三 个 基本 的 抽象 概念 : 文件 是 对 TO 设备 的 
抽象 概念 ， 虑 拟 存 储 器 是 对 主 存 和 磁盘 的 抽象 概念 ， 进程 是 处 理 器 、 主 存 和 TO 设备 的 抽象 概念 。 

最 后 , 网 络 提供 了 计算 机 系统 之 间 通 信 的 手段 ,从 某 个 系统 的 角度 来 看 , 网 络 职 是 一 种 TO 说 备 。 


参考 文献 说 阴 

Ritchie 写 了 关于 早期 C # Unix 的 有 趣 的 第 ~- 手 资料 63，64]。Ritchie 和 Thompson 提供 了 最 早 
出 版 的 Unix 资料 [65]。Silberschatz 和 Самото T X: F Unix 不 同 版 本 的 详尽 历史 。GNU 
(www.gnu.org) 和 Linux Cwww.linux.org) 网 页 有 大 量 的 当前 和 历史 信息 。 不 幸 的 是 ， 无 法 在 线 获 得 
Posix 标准 ， 必 须 通过 IEEE 〈standards,jeee.org) 定购 。 


”第 1 部 分 
程序 结构 和 执行 


| 人] 现 计 算 机 系统 的 探索 是 从 学 习 计 算 机 本 身 开 始 的 , 它 由 处理 器 和 存根 句子 
我 东 锦 组 成 。 在 极 心 邵 分 ， 我 们 需要 方法 来 表示 基本 数据 类 型 ， 比 如 整 烙 和 实 
"лшн. ЖЕ, ЖЫП ЕП ЕШ®ИЕ FIX IE, ШЕН 
кесе = АНЯ С ВЕРЕН, MET, ЖЇН ЛЖИ ЕМЕ ЕТЖ. X 
Н TERAPAN. ВАНТ ТЕНЕ, ИПИ 
HOSTIAE ОГЫ н ISIS, ЗЕТ НОВ СЕРЕН. epis ass 
RBN SSD RS, ЕСН НИ В 
TOR B IRS A УШЕШ НЕЛЕ ТАЕ ЖЛЕ. ТЕХ 
Шш, ИШЕНЕ ers. 
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В ААР О SS клад. ЕКСЕ. ЖІ (bit), Ет 
了 数字 革 合 的 基础 ， 大 家 熟悉 的 使 用 了 1000 多 年 的 十 进 制 (以 十 为 基数 ，base-10) ӘЖЕНІ, 
在 12 性 纪 被 阿拉 伯 数 学 家 所 改进 ， 并 在 13 НС AAR ER Leonardo Pisano. (里 有 名 的 出 法 是 
Fibonacci) 带 到 西方 。 使 用 十 进 制 表 示 法 对 于 有 十 个 指头 的 入 类 来 说 是 很 自然 的 事情 ， 但 钙 当 构 阁 
站 情 和 椒 理 信息 的 机 器 时 ， 二 进 制 值 工作 得 更 好 。 二 值 信号 能 髋 很 窒 易 地 表 沙 、 丰 赃 和 层 输 ， 例如 ， 
可 以 表示 为 穿孔 卡片 上 有 洞 或 页 洞 、 导 线 上 的 商 电 压 或 低 电 压 ， 或 者 嵌 场 引起 的 顺 时 针 成 刻 时 针 。 
基于 一 慎 信 号 的 存储 和 执行 计算 的 电子 电路 非常 简单 和 可 靠 ， 使 得 制造 商 能 够 在 一 个 单独 的 仁 片 上 
集成 日 万 个 这 样 的 电路 。 

昔 独 地 来 说 ， 单 个 的 位 不 是 非常 有 用 ， 然 而 ， 当 我 们 把 位 组 侣 和 企 一 起 ， 再 加 上 呈 种 解释 
Cinterpretation)， 即 给 书 不 同 的 林 能 位 模式 以 含意 ， 我 们 就 能 够 表示 任何 有 限 集合 的 元 素 。 比 如 ， 使 
用 一 个 二 进 制 数 字 系 统 ， 我 们 能 串 由 位 组 来 编码 二 负数 。 遂 过 使 用 标准 的 宇和 罕 码 ， 我 们 能 贸 对 У 
交 档 中 的 字 世 和 符号 进行 编码 。 在 本 章 中 ， 我 们 将 讨论 这 两 种 编码 ， 以 太 表 示 贫 数 的 编 治 和 近似 实 
数 的 编码 。 

我 们 考虑 -种 最 重要 的 数字 编 色 。 无 谷 号 (unsigned) 编 玛 是 基于 传统 的 一 进 制 表示 法 的 ， 表 
未 太 十 或 者 等 本 零 的 数学 .二进制 补 码 【twos-complement) ІЗЕЗОХН ASEA NE APAT 
AR S SEE EIE E AMEA. t AK (floating-point) 编码 是 表示 实数 的 科学 记 数 法 的 昼 
二 为 基数 的 万 本。 计算 机 用 这 毕 不 同 的 表 相 方法 实现 算术 运算 ， 例 如 加 法 和 习 法 ， 类 似 十 相应 的 加 
数 利 实数 运算 ， 

计算 机 的 表示 法 用 有 限 的 位 数 来 对 一 个 数字 编 妈 ， 认 此 ， 当 结果 赤 大 以 至 不 能 表示 时 ， 柴 些 运 
8 Н ‘overflow)。 这 会 导致 某 些 令 人 吃惊 的 后 果 。 例 如 ， 在 大多 数 今 天 的 计算 机 上 上 ， 计 算 表 
达 式 200+300*400*500 2:15 10-884 901 888 .这 违背 了 昔 数 运算 的 展 性 一 一 计算 一 组 让 数 的 乘积 产生 
了 一 个 为 负 的 结果 。 

ң 方面 ， 整 数 的 计算 机 运算 满足 了 真正 整数 运算 的 许多 普通 的 属性 。 例 如 ， 静 法 是 可 结合 
МБА 0, AR- -来 计算 下 面 任何 РСЖ. HAS 884901 888; 

500407) *1300%*200] 

: (500*420) +300) *200 

:(200*500) *300) *400 

400*(200* (300*5001) 

wWRSQIBOSrCEXTBTUS SS. ШЕТЕЛ £t! 

FERATE B CERTE. 虽然 着 出 会 产生 特殊 的 值 +o, (EI ЕЗ Ж ЕДА ЛЕ IE Bi. 
为 一 上 四 面 ， 由 二 表示 的 精度 有 限 ， 浮 点 运算 是 不 可 结合 的 。 枫 如 ， 存 大 多 数 机 器 上 С AX 
(3.14+1e20) -1e20 KAKAZ 0.0, fj 3.144+ 1820-1200 求 得 的 值 会 是 3.14, 

通过 研究 实际 数字 的 表示 ， 我 们 能 够 了解 可 以 表示 的 值 的 范围 和 不 回 算 术 运 算 的 属性 。 对 于 编 
乌 在 全 部 数值 兴国 内 都 能 正确 工作 ， 而 且 可 以 畴 工本 可 机 器 、 棋 作 系 统 和 编译 器 组 合 的 可 移植 的 程 
序 来 说 ， 这 种 了 解 是 非常 重要 的 。 

计算 机 用 几 种 不 同 的 _ 进 制 表 沙 来 编码 数值 。 在 第 3 章 中 随 着 你 进入 机 器 级 编程 ， 你 将 需要 熟 
东芝 鱼 表 示 方 式 ， 在 本 章 中 ， 我 们 描述 这 些 编码 ， 并 给 你 一 些 关 于 数字 表示 的 推理 练习 。 

明 过 和 直接 操作 位 级 的 数学 表 东 ， 我 们 得 到 了 所 种 进行 算术 运算 的 方式 。 理 解 这 些 技 术 对 于 理解 


АНА Ф | 23 
SOR dH ЕК ЕИ ЕНЕ FCR RE E 12 
Rees q ЕЛЕЕ АКЕНИ. ИПЛЕ EA Ж I, PARS OSM, inn 
可 表示 的 数字 的 范围 、 它 们 的 位 级 表示 以 及 算术 运算 的 属性 ， 我 们 相信 从 这 样 一 个 抽象 的 和 点 来 分 
析 这 些 内 容 ， 对 休 来 说 是 禄 重要 的 ， 因 为 程序 册 需 要 对 计算 机 运 掉 和 更 为 人 热血 的 整数 和 实数 运算 
之 间 的 医大 有 牢 国 的 理解 。 尽 管 这 看 起来 很 钙 估 ， 但 精确 的 处 理 只 需要 了 解 基本 的 代 归 如 识 。 我 们 
E p аена з 


њї т ЭМ E сатр" "EE NC. Г d, ai ow s 
>" 5 d CL 


| ° = e 5 
4. = а [] ë М. Г) F L — TJ "n 
Ko Rt d Me vu] АКАЙ. хош. 
a LI =. E m u ш l. | "n " 4” Е | в * 
а | LI 


| 3. ч Г “ 
| Та L | š gu" a i 
7 " Li 3 ] в m =a J 
i N I [| L | | ” іш! “Же 
а gps ls" B i г А "E B k A, i ! ЛЕ LAU " 
Li š - ^ 2 hå „Шз ; в " | а т й = A 
3 " Í L| Е | 
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F Li Ті! > Е e, d 了 ч FP z w 4 
| т 1 
*Y ГЕ i 4! T 
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CHARR ЖЕ С 2 E, 使 用 完全 相同 的 数字 表示 和 运 得 。 在 可 章 中 关于 "m 
С++# Ж. J-i, Јама BS QJ T ERE E RENAEM.CHÉEÉHHdULtTIEE 
实现 方式 ,而 Java ЕЕЕ ЕКИ ЕНДШ КЕНТІНЕН. ЕЕ ЛАТ Т 


Java З КРЕНЕ НИЕ. 
21 信息 存储 


大 事 数 计算 机 使 用 3 位 的 块 ， 或 叫做 丰 节 Cbyie)， 来 作为 最 小 的 可 寻 址 的 存储 器 单位 ， 而 不 是 
ШИРИП ORIS (Y. 机 器 级 程序 将 存储 器 搞 为 一 个 非常 大 的 字 节 十 组 , Кдй АА Е. (virtual 
memory), 好 人 鱼 凯 的 每 个 字 节 都 由 一 个 性 一 的 数字 来 标识 ， 称 为 它 的 地 址 Caddress》， 所 有 可 能 地 址 
ЖТИ нні (virtual address space》。 正 如 它 的 名 字 囊 明 的 ， 这 个 虚报 地 址 空间 只 是 
一 个 展现 座机 器 概 程 序 的 概 洛 性 晓 像 (image), ЖЕМІН СЕҢ I0 章 》 司 用 的 是 随机 访问 在 储 器 
RAM. ЕЛІН. ИЯ ЖЕКПЕ. ИВО IHE EE TUR. 

REB TIR REIS 71 (Ee ACE A UE T FEE E f ӘЗ тел, ЖЖ 
ER. (program object), ЕЕ, EARE, НӘНЕНИЯ. HER BRL GT DL ЖЕНЕ 
理 程 序 不 同 部 分 的 存 桩 。 这 种 管理 完全 是 在 虚拟 地 址 空间 里 完 成 的 。 例 如 ，C 中 一 个 指针 的 值 CE 
泥 它 指向 一 个 整数 一 个 结构 或 是 某 个 其 全 程序 单元 ) 都 是 某 个 存 赃 块 的 第 一 个 字 节 的 庶 拟 册 址 ， 
С 塌 评 路 还 把 紫 个 指针 和 类 型 信息 联系 起 来， 这样 它 就 可 以 根据 指针 值 的 类 型 ， 生 成 不 同 的 机 器 级 
Tersus aps ЕВР ТАН Riti). КЕСЕНЕ ЕЛІҢ, НЕЕ 
КЕШЕН АРЕН. CM ORIPREHIHRIERERON URS. ШИНЕ 
看 做 一 个 字 节 序列 。 
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21.1 十 六 进 制 表示 法 

一 个 学 市 包括 8 位 。 在 二 进 制 表 示 法 中 ， 它 的 值 域 是 00000000, 一 11111111;。 如 虹 看 成 十 进 制 
EE ШЕЕ Di 255io。 丙 种 符号 表示 法 对 于 描述 位 模式 来 说 都 不 是 非常 方便。 一 进 制 表 
ТЗЕЖЛ, К, 向 使 用 十 进 制 表示 法 ,与 位 模式 的 互相 转化 很 麻烦 , 替代 的 方法 是 , 我 们 以 16 o 
或 者 出 舌 十 六 进 制 (hexadecimal》 数 ， 来 书写 位 模式 。 十 六 进 制 (简写 为 “Hex”) 使 用 数字 "0" — 
“9”, ФТ "A" ~ “P” ЖЕ 16 ИЕ КИН, BL 2.1 Ra T 16 个 十 六 进 制 数字 对 应 的 十 进 
市值 和 二 进 制 值 。 败 PvE) S. ТВИН 0047 ЕЕ 

Ст, DL Ox ОХ 开头 的 数字 常量 被 认为 是 十 六 进 制 的 值 。 字 符 “A” 一 “F” 婚 可 以 是 大 
写 ， 也 可 以 是 小 号 ， 例 姐 ， 我 们 可 以 将 数字 FAID37B,, 写作 OxFA1D37B, RE 0xfald37b， 其 全 是 
大 小 写 混合 ， 比 如 ，0xFalD37b。 在 本 书 中 ， 我 们 将 使 用 С 表示 法 来 表 小 十 六 进 制 值 ， 


ТАЙЫН 
| 进 制 秆 
„ЖИШП 





821 ”十 六 进 制 表示 法 
PHA TAREA IS Tb КЫТ T QS. 


ШУМЕ T EE E ЕЛИ er Е-Е СЫЯ T HE] 2 IR] SE 
iR. = 1 ЖЫ DO АНЫ HER, ВЕ ар ARAT -个 十 六 进出 数字 的 转换 。 数 
Та & ЖЩ 2.1 所 示 的 表 。 在 你 脑 中 做 转换 的 一 个 简单 的 窒 门 是 ， ТӘН НЫ А. С 
和 下 相应 的 十 进 制 值 。 而 对 于 把 十 六 进 制 重 B、D 和 翻译 成 十 进 制 值 ， 则 呆 以 通过 计算 它们 与 前 
= МАНАН X ЖЕЛЕ. 

比如 ”假设 给 你 一 个 数字 0х173ААС. 可 以 通过 展开 每 个 十 六 进 制 数字 ， 将 它 转换 为 一 进 制 格 
式 ， 如 下 所 示 ; 

еН 1 7 3 A 4 C 

二 进 制 0001 0211 0011 1010 0100 1100 


XXE dT oso 000101110011101001001109. 
БАЖ, ACORDES ТЫЫ L1001010110110110011,. Фа B ЯД ЕЦ 
世 一 组 ， 来 把 它 转 换 为 十 六 进 制 。 不 过 要 注意 ， 如 果 位 总数 不 是 四 的 倍数 ， 最 左边 的 一 组 可 以 少 二 
四 位 ， 前 面 用 零 补 是 。 然 后 将 每 个 四 位 组 转换 为 相应 的 十 六 进 制 数 字 : 
一 进 制 11 1:00 101€ 1101 1011 0011 
-六 进 制 3 C A D B 3 


TE 8.65 Ж e t Pt 25 
БЕШ 2.1 | с З.И: 
ЗАТЕ: 
А. VF ÜxBFTA93 Есі. 
B. Ж ЛШ) 1011011110011100 特 撞 为 十 去 进 制 ， 
C. Ж (x CAESD 转换 为 二 进 制 ， 
D. а 1101011011011111100110 fk 39 T i dej. 


MH AE, 也 就 是 ， 对 于 某 个 m, хе, 我们 可 以 报 容易 地 将 x 写成 十 六 进 制 形式 ， D 
要 记 住 + 的 二 进 制 表示 就 是 1 FER, Ж. HARARO КЕЗ о. 所以， 对 于 被 写 
Hi Ж нп ЖШ, Досе 3, 我 们 可 以 把 x 写成 开头 的 十 六 进 制 数字 为 1 Сай), 2 (ігі), 
4 (m2) BCN Я (i=3), ЕШШ у 个 十 六 进 制 的 0。 比 如 ，z=2048=2"， 我 们 有 n=1] =3+44.2， 
从 而 得 到 十 坟 进 制 表示 0x800， 


ЊУ 22 РР 
ктен, mr LN d 





КЫШИДЫ nce [8] f e P EE REL ЕН КЕИ: ЖАНЕ - NS. e 
х®®З АЖЫ. RATUR ORE 16 t х, ERIT EG PR Ii х=а- 16r. 
然后 ， 我 们 用 十 元 进 制 数字 表示 的 了 作为 最 低位 数字 ， T HB DS a 反复 进行 这 个 进程 禄 到 剩 下 的 
EF. Bm, ЗАЧЕМ 314156 的 转换 ， 

314156 


19634 = 1227-1642 (2) 
[227 = a (B) 
16 = 4.16412 (C) 
4 = 0.1644 (4) 


МАН, ГЕН ҒАНЫ Ж cB, 


ER. -tt ARAE ER НЫҚ? 我 们 可 以 用 相 庶 的 16 HERL TA h 
MW. ЕШ. MERT 0x7AF， 我们 计算 它 对 应 的 十 进 制 值 为 7. 16 4 10-168 158 72564 10. 16 
+ 1521792 + 160 + 15 = 1967, 
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Г Es» АНИ, ШЕТА PRENA, pik ден. 
сиетті еі: 
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X. 十 进 制 和 十 六 进 制 间 的 转换 
ьтатанет а ная АНИК, наши 
创 如 ， 下 面 的 Per Tbk ФА Tie FEN. 





ЖЖ КЕКИ, 





; codeldatald 2k 
#! /usr/local/bin/perl 


# Convert list of decimal numbers inta hex 


for (51 = 0; 51 < GARGV; $i++) Í 
printf ("sd\ts üx&xin*, $ARGV[S$i], SARGV[Si]); 
) | 


C un ік орт ә 





code/data/dzh 
-At At mir, $. 
unix- ./d2h 100 500 751 
$i d. 

100=йх64 
5DÜzÜüxlf4 
T5lax2of 
———— 

Li етік - ай. ZEE 
] TES IIO PES ите" FT 


а % Convert list of hex numbers into deci 
3 
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4 for [$i = D, $i < BARGV) Sis) фат | БЕГ: 
5 val = hex($ARGV[Bi]):; 000000000 
E — printf|*üx&x = . Маа", $val, мар: id š 

1 


ж 
і 
š 
i МЕ 
Ti 
=. E 5 E 
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ТУНА ТУА d сн, vorn Ла ө. ЯКМ. ФЕНА. 提示: 
ЕРА Oder ibd КА ӘБЙЕНЕЛІҢ Ж. LIGAS ER. 

А. Ux See XR 

В, 05502-05 He 

C. 0502—46 

D. Ох Ма 0х 50269 


212 Т 

BEIMA- 6 (word size), ШЙ Ж ЖИЕ ИЕШЕ; А (nominal size). Bd 
МИИН ЖЕ ША FER FORI 0. Br ELE KIP ЕЕЕ B e M UC I LH ЗУ [u 0138 Э 
大 小 ， 也 就 是 说 ， 对 于 一 个 字 发 为 n CARENE, ЖЕНЕ 0—2-1, БЕЙІН 
"ү. 

РОЧ АЕ 92 m. EMT ЕЛІНЕН 4 Е CHA AGB), 也 
WE. ИНЕНІ 4x IUE T. Е ЕТА, Т, {ЕЕЕ ИЕ 
大 型 的 科学 和 数据 库 应 用 需要 更 大 的 存储 了 。 因此 , ВЕДРЕ ННН Е, З 64 {ЕИ 
ГАТР НАЕ Е, 


213 数据 太 小 

ЕНЕ ЕНЕ SC ECT. ЕШЖНЕННЕНЕЗАШҚ, DEBERE 
TWct. Hm. РЕЛЕНІ I TEE. riki е W. ІШЕДІ 
Win. ЕНЫНФЕНЕЛЫЛЕВНАТИМИАН,. 

СЕНХНЕКИЛАЕПЕНЕЯНЯ.СІНЕНЕТ char 表示 一 个 单列 的 字 节 , 尽管 sehare 
BT ACER IBTTWX DEB mpm eder» 5 m m xe. IHE B i e RI ЖЕ. 
СИЕТ im 之 前 还 能 加 上 限定 词 long 和 short, WRA Kc nt ka. 图 22 WORT 58 
FC 数据 类 型 分 配 的 宇 节 数 , ЕВЕТТЕКЕТИННЦШЯН АНТЕ Т Г зе 的 例子 ， 
A RES 32 位 机 村 和 Compaq Alpha 体系 结构 ， 其 中 Compaq Alpha 是 针对 高 端 应 用 的 64 ВВ. e 
XM 32 位 机 器 使用 “典型 ”的 分 配方 式 。 可 以 观察 到 ; "Int WS JS, WD 限制 的 int 
АЗЫ, "KU ЖЕЕ УЕ. 

Н 2.2 也 说 明了 指针 例如， 一 个 被 声明 为 类 型 为 “char ** 的 变量 ) НОЧ, 
监 机 器 还 支持 两 种 不同 的 浮 点 格式 : ЖЫН (E C rp Н Ж float) 和 观 精度 :在 C 中 声明 为 ol 
а dr НЩ p iF Л ЗҮ, 


chair 
&hort int 
inr 


long int 


double 


22 СЕШ+ФЕТРТ ЕЕ ШИА (Ыш) 
TERTIAR ШЕШ ан E] # El. 





© C 语言 初学 者 ， 南明 指针 
МЕНШЕ Т, bw 


T "p; 
&üp3—rtü4tk*, HRS TH- Ë. d 
char *p; | 





就 将 一 让 指导 声明 为 指向 char 囊 型 的 一 个 对 章 ， 


程序 总 应 该 力图 使 他们 的 程序 在 焉 同 的 机 器 和 蝙 译 加 上 可 称 植 。 可 称 植 性 的 一 个 坟 面 就 是 性 程 
FA НЕ ЖИНА ХААА. C 标准 对 下 同 整 据 类 型 的 数字 苍 围 证 置 了 下 界 ， 这 点 在 后 面 
还 将 诗 到 ， 但 是 却 没 有 上 界 。 因 为 32 位 机 里 在 过 去 m 年 里 一 直 是 标准 ， 许 多 程序 的 坊 写 趣 是 以 图 
2 中 “村 型 的 到 但 机 器 ” 列 出 的 分 配 诛 则 为 假设 的 。 在 不 久 的 将 来 ， 随 者 64 位 机 器 趟 来 赵 重要 ， 
ER ASA Н ИНЕ ЕНТ, FERRU FERRARS ВА НЕ, ЕНА, ЕШ, Рр 
БЕРБЕ АГН m 35 Hf REPE SE ПЕЕ РЕ ЗЕ ЕВЕ t Dir KEW o Е I P W: 
EW. {Н ТЕ — E: Alpha ИЕ ЕА SERERTIÉ. 


214 寻 址 和 字 节 顺序 

村 于 插 起 多 字 节 的 程序 对 象 ， 我 们 必须 建立 两 个 规则 ， 这 个 对 象 的 地 址 是 什么 和 我 们 在 存 请 器 中 
六 何 灶 训 些 字 芭 排序 。 在 几乎 所 有 的 机 器 上 ， 套 字 节 对 痕 者 被 存 赃 为 连续 的 字 节 序列 ， 对 数 的 地址 为 
所 使 用 字 节 序列 中 最 小 的 地 址 。 Pl, Su — 438533 inr 的 变量 + 的 地 址 为 0x100， 也 诸 星 说 ， 地 让 
ых 的 值 为 0x100。 NEA... x 的 四 字 节 将 想 存 健在 存 矿 器 的 Ox 100, Ox101. 0102 和 0x103 y Ж. 

寺 改 平一 个 对 龟 的 字 节 序列 排序 ， 有 两 个 通用 的 规则 。 考 诬 一 站 w RW. TY KD A 
Aer Us dp Жа], Roehr EM. x ДЕ ЕШШ. Bu.uisHsm. ШӨЖЕ 
НЫЛЫП, РФ ИСЕН ТН nas 5.) cona] ШЖ НИЕ BRL ee л. =Ó, 
xy]. ЖЕҢ Р Шу. ЕА И ЖЕ ҮН ГЕЗ ШЕ 
Ml. її —*H ИСЕ ДВ ТГ СЕ Wali CCS НЕЛЕ. Т — EIU RUE 
TUSCE BE RB hiii O38038]. 368 Ж (lile endian). K Ж 888 8 ШЙГЕ) Digital Equipment 公司 ! 现 
(ЕЛЕ Compa 公司 的 一 部 分 》 的 机 器 ， 以 及 пы 的 机 器 元 采用 这 样 规则 。 后 一 种 起 吕 【最 高 有 效 字 
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节 在 最 前 面 的 方式 ) У АА Cbig endian). IBM. Motorola 和 Sun Microsystems HK E ЖЖ 
都 采 用 这 入 规则 , 注意 我 们 说 的 是 “太吉 数 " кН ЕНЕ fep ERU DIT. 比如, IBM 
制造 的 个 人 计算 机 使 用 的 是 Intel КЕНЕН, КАТЕР. ТЕНИ; Н, 包括 Alpha 
和 Motorola 的 PowerPC, Eai E Rh, 其 取决 于 4 Mh ps a mrt meu, 
ЖЕП МӨ. ИШЕ Y 类 型 为 im ӘМ 0100 Ж. t УНИ 
0x01234567。 地 址 范围 Ox100--0x103 Ё ЕНА РЛ RE D mt. 
Хан 


0x100 Üxiüi Ox102 ix103 





Tug i 





| 
注意， 在 字 001234567, yI 0601, ШИЕ CS 0567. 
TAERE. EERE ERRETINA HE E, АЗЫҒЫН. TE F. Жа 
“little endian (4877 K "big endian СД)” 3 BT Jonathan Swift 8). (ЯНА (Gulliver's 
Travels), op ERIT TH ETHIC GR REI МЕ — 4 — 1] MGE R Kiki— J ET Айн E 
WO. NE FE. ИНЖЕНЕРЫ. НЕРМОШЕНЛЕТЫӘН 
ЕНГІ. БЕ а анан. 
4 ЗЕТ дарна 


dor IL. B. эй i? I rer мн 25 A pun 
gal М | I Зи. [ Li . 
= z= ES та т | 
NE vU Ve rod vd 
e ль ЫШ ий іні oA 
i 4 ЕЕ | " в 
! M E m Е | 
y "e =й" w" im 本 -" 
А ы 






а! 


Г 2 


Д мн 
u ° -% uf d з zx 1 Е. F “т 
PEN OVER Sos KQ ЕРЕ 
T ші р а тең Р I> 
“PR: 7 қ k. | T r bs i 1 
оты : d |: | E E m 
ұрты BI E M TS 
& 2 WEM Ж 1 j 
БЕРІ x: 8-1 ША E — Шеш n "n БЕ p * „ка t 
m -— 古 ЖИ a ; қ 
而 ! а z s ae ^d. шм,” Ге а” š 


k uh IET 






z i 4 
> I BÀ $ = di Fe , 4 I 
EN о. Г a pe { е 1 ч — | 






кл 
== 


| 对 于 大 事 数 应 用 程序 员 来 说 ， 他 们 机 器 的 字 节 顺序 是 完全 不 可 见 的 。 无 论 为 哪 种 类 型 的 机 框 所 
M IF FPP: R. НИК. ЕЗШЕ ДЕЗИН. ИЛЕЛИН ИНИ 
fa ir pa Bs fiet ШЕН, — FR IIT BILE 94 АТ аера E ILI IE 
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TRH, RREFEN ЗНАЧЕ Т Т ЕЧ. ЭТ йл, мм НІҢ 
ңа Drm РНЕ КИН. ПОЙ ЖОЖ ЕЕН Ж RR ИНЕ, ІП 
ir НЕШ ЖЕБЕ ЖЛЕ НЕК. МІНЕ 12 章 中 看 到 这 种 转换 的 例子 。 

ЕА Еа EE m HE SET EEENETS5EnH. Xu SE ЈЕ. 
铬 程序 时 ,作为 一 个 示 出 ARTEA Г FUE. ЖЕҢНЕН T TERT Intel ІНЕ 
КӨ НЕТУ Ж.Ж: 

әмірі: 01 05 64 84 14 p8 add Ұсах, DyxyB0439454 

IK —ITIE НЧА ЗГ AS EE Cdisassembler? СЕНІП, Fro S А — db a] T ЕТТЕН ЖИН 
ФРАНТ. ЗЕТЕ ЕА У ЗСШ ЕТ ДЕННА, ЦАН ЕНТ. БН 
Е. ВПАЛА ТТЕ IT ARES 0105 64 94 04 06 ЕУ УЕ к. ЕЖ 
ЕЧ С Е ВАТЕ T Ti буды [ИГ F. АНТЕ HET PER Е Е ШЕ 
h: 649404 OB, ЕСН А ОЖАР ЕЕН. ЕНІН OR O4 94 64. ЕМЕЕЖ, ТЕ АНИ 
üxRO49464, ЖЕЛЫҢЖНЕНН, АТАТ lh PETERET BLUR "E С ВН ШЕЕ AERE. Ж 
"eM ЕЛИНЕ КШ. ВЕ ЕАО А K ЖЕЕ КЛ ЕД. ПИ ТЕЧЕ 
КЛ, En RE ЕН АН У ЛЕШ. МЕНЕН Т ЕИ! Б ЇЇ]. 

ЧИРЕ ЦГА ÁW E ЧУНОНЕ КАА ЕН. САҒЫ, ІШЕ 
ХЕИ А SA (cas ТЕШ РАЕН ОЕ Е kai kall T S. CER 
ПРЕ НА АКЕ ЕЛ). ЕДЕТТЕ IER IEE HIN. ЕН. 

图 23 к Г ВЕС КЦ, ЕТЕН КЕ ОНТ EB ЕЕЕ IE E Жж. RHET 
用 typedef ЖЕНЕ byte pointer 定义 为 一 个 指向 类 型 为 “unsigned char” 的 对 象 的 指针 。 这 样 一 
个 衬 节 指 御 引用 一 个 字 节 序列 ， 其 中 手相 字 节 都 秆 认为 是 一 个 非 负 束 歼 。 第 一 个 例 程 show_hytes 的 
ВА ЕТТЕРИ НЕНЬ СЕ РВЕЗЕ Е У Ш-Н. show bytes 打印 出 以 十 六 
ЕНЖАР. CERE? “ақ” ЕЛЕЕОЯНЕФИРЕТІҢРАҒЫН Н. 


H C BB MES ТЕН typedet ЖЕНЕ 
C 中 的 typedef P JR T ft ACD de MEA, а 
KA EET Жаңа. 
typedef didi 5 Band Grind. T TEN SERS 1, AZARES. AA, 823% 
е. pointer 的 声明 和 将 一 个 变量 声明 为 类 型 "unsigned char” 有 相同 的 形式 。 
+, - 
typedef int *int pointer) 
int pointer ipi 
ЖЕШ "int pointer". 5:35 — УН inre dp, Ж#Н ASTU EE ip. ANETA 
直 禄 声明 这 机 宽 量 为 ， 


int Тір; 




















| code/data/siurw Bytes. c 
1 include «stdio. 
2 


В. k fo PP 31 
a 
J typedef unsigned char *byte_pointer; 
1 
3 void show hytes(byte pointer start, int len) 
65 | 
7 int ij 
H far (і = D; i < len: i++] 
3 ргіпЕГІ" &.2x", gtart[i]): 
1Ü printf(*'Ain*); 
11 1 


13 void show intíint x) 

14 { 

15 show Бугев( (Бүре pointer! Ех, sizeof(int])j 
16 ] 


18 void show float(float x) 
19 1 


10 show bytes(ibyte pointer] &x, sizeofifloat]); 
21 ] 


43 void show, pointer(vaoid wx) 

44 | 

15 show bytes[(byte pointer) &x, sizeofivold *]); 
26 | 


23 打印 程序 对 象 的 字 节 表示 
ан аенаманнажиявт ан. 








4 L] 

" | к. 

EM ^ | E 
% 


"c EE ШЕТ ги МУҢ Е ni А hÀ \ j li 


过 程 show int. show float 和 show. pointer 属 示 了 如 何 使 用 祷 序 show bytes ЖШН ЖЕЛІ 
im. float 和 void е) С 程序 对 艇 的 字 节 表示 。 НП ҖЕНЕ ГИЯ HEB E show. bytes 一 个 指向 它们 
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ЕШ КИНГ &х. НАНЫН ТІНЕ "unsigned char *". IK PS 8 pl ЕВ P UE RE Н. 
BI n А BTE CIBELES Pen], MTER T THES NEHME. MB. ET E 
THREE II XT ЖЕН IL HAE SE TH RE = 


给 心 语言 初 举 者 ， 指 针 的 创建 和 间接 引用 

在 图 2.3 的 第 15. 20425 17. 表 们 看 到 对 已 和 Cit 中 两 种 义 有 操作 的 使 用 。 己 的 “ 取 地 址 " 
ШИНА, ЕФ, Аах 创建 了 一 小 指向 保 站 变量 у 的 位 置 的 指 村 。 这 小 指 
+ SORT x 的 下 和 型， 因此 这 三 小 指 料 的 可 型 从 刷 为 int*. oae void**, CAE E void*E 
-HHR THH. ажа.) 
ep £t X gba EHE X M. 因此， SGS bi Inyte pointerl 
kx Jd ibd cc EAS ЖШ. ВИАН Е h unsigned char МЕТ. 


Д РОТЕ Н C 的 运算 符 sizeof 来 确定 对 象 使 用 的 字 节 数 ， 一 般 素 说 ， 表 达 式 sizeot Tii [ddr 
КАН ТШЕК ЕЧ ҮЕ. WH sioi mI T ER Epp dmg 
ЖМ rupit —ib. 

fc LP ERES LETEA 2.4. ты, НІНЕН 25 ЕЮ R. ТШІШ FEL: 

Linux: Intel Pentium I 5 {т Linux. 

NT: Intel Pentium П iz ^T Windows-NT. 

Sun: Sun Microsystems L'ltrasPARC iz 1T Solaris 

Alpha: Compaq Alpha 21164 1517 Tru&4 Unix. 














ААС code/davskew-byres.c 
1 void Lest show bytes(int val) 
21 

1 int ival = val; 

1 Float Ета] = (float) ival; 
5 int *pval = &ival; 

б shcw intíival]; 

7 аһом. float[fval): 

B Hew pointeripvall; 

E 


caderdata/shaw-hytesc 
24 宇 节 表示 的 示例 
ixRHCPHMIHI T NN Те АТ 
RATE W 12 345 НИ Ет Ox00003039.. HF im МЕНЕ. ЫТ ЕЩ. 

ИП ЕЛЕН НЕ R. ЕНІН, ШЫПТА ЕЕ Linux. NT Alpha КЕ. Bii frs 
TOW 0x39 ЕНЕ. ЕНЕ АЕО, fud Sun 上 最 后 输出 ， 这 说 明 Sun EAREN, 
ü. BEBE. Поа 基 型 的 数据 ， 除 了 字 节 顺序 以 外 ， 也 都 是 相同 的 ， 另 一 方面 ， 措 村 值 却 是 完全 下 
同 的 ,不同 的 机 器 / 婴 作 系 议 配置 使 用 不 同 的 存储 分 配 规则 , 一 个 值得 注意 的 特性 是 Linux 和 Sun 的 
ЖЖ ТЕН ИЩ ГНЕВЕ, WL Alpha (ERI Wi. 
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Ес ad 
EE 1f 01 00 00 00 


k: 25 TENDS 
B ITNUELLHE, int 和 float A EE — ВЕНА. НЕ Ж XS. 


шын WE AUR SERICN NE RE RU 12 345 Ж. RUTH АЕ ЖА I] ИЙ. 
EST OxO0O03039. ШАА Ox4540E400.. BME. BBM RD. ind 
我 们 将 这 些 十 六 进 制 模式 扩 ТЕТІ 并 目 适当 地 将 它们 称 位 ， 我 们 就 会 发 现 一 个 有 13 个 相 
区 卫 的 性 的 序列 ， 如 下 而 的 一 串 星 号 标识 出 来 的 式样 : 

10 0 3 оз 9 
gbgpüDODODODODODOD1l1000000111D01 


Fk k k k k RR š K RK Е а 


4 B 4 ВЕ d Q Ü 
01000110010000001110010000000000 


Нее i eei ETE 


ТЕЗЕТЕЗІЗЕЗ:Е 











SA TIO шекке nm 

int val = 0x12345678: 

byte pointer valp - (byte pointer) &val; 
алом bytes[valp, 1): /* A. */ 

&how bytes([valp, 2): /* B, i 

show byteas[valp, 3); /* C, wi 


MEE dBSEdiGEREL. ЧИННЕ ЧА. 


A. dE: Xi. 
B. dd. X ET 
C. 1-8; xd ET 


NU QU і 1 
Tem. c Se 


g: 1% 24 1 "= ЕЕ j p^ ч ir ) EDU p q ; 3 re nd e Ah n = АА E А, 
使 用 show. int 加 bin Bout, 我 们 确定 整数 3400593 8 + 540 тэ Ox00354321, 8$ E 





14 42% 


3490593 Ü HT AHATA Ox4A550CRA, 
A. GERA iM е фт, 
B. Жк РН K. PIR li Аа Д k. 
С.ЖЕЗДІНЕКЯ? Фр Н Ф Tan й? 
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Сп ЕНӘ Аы y FEL null ҢА» ЗЕРРЕ ЕВЕ. ӘУЕН ЖЕ 
ыж, 最 常见 的 就 是 asci FEN. ЕН. SERI SE “12345” ИІН ЖО 
ЖГ show bytes, ЕТЕ E 31323334 35 00. 请 注意 , ТЕШЕ х J ASC ШИЕ 
R Оха. if] f£ F ЛҮ HE Е # т 0x00. {ЕТЕН ASCH AA УТТАШ НЕНЩ AREE ЕЛЕНЕ 
Adige. SFUMATA ANE. НІП, TEARRE- Bi si ЕНИ И ЕШ 
性 。 


Et 生成 一 张 ASCII $ 
可 以 通过 执行 富村 man әсі 来 得 到 一 张 ASCIT ER А. 


85127 

Тая show bytes ЁЗ Ж ЕНГЕН 2 k Ж? 
char *& = "ABCDEF'; 

зба bytes(s, sErlen(ís)) 


EEFI “А” = СР ñ ASCI 2439 0541 = 0x5A. 


ЯН. Unicode (J£— ЗЕТИ Е FHA 

ASCI АТЗ Е, dc B ku ИЧОРА EPA, Wik 
ie] "C. EX + Ri ЛЖ NOE. Wade Riki ka 48. Жы. 164206 Unicode FHS 
ЖАЛ ЖЕНА ЕЕ. ВАТТ ЕНАА ТИНА ЕТЕТ И А Е ГАВ. Java 
МЕЧ Unicode && r5. э C а= Д d HOS Unicode B 3-8 deg Е 3 
ЖШ, idv strlen 和 strepy. 


21.6 表示 代码 
HE FY C Н: 
1 int Bum[int x, int y] 
“ Í 
return X + y; 
3 | 


Ard ЖИН ГНН, ЖЛЕ q W F W 6 o: IML ЕШ. 
Linux: 55 39 е5 Bb 45 Пс 03 45 DB 89 гс 5d c3 

HT: 55 39 25 Bb 45 Dc 01 48 ПЁ 85 ec 5d cj 

Bun: Bl c3 ЫР 08 90 02 00 09 

Alpha: 00 DO 3D 42 01 Bü ҒА ЕВ 
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这 里 我 们 发 现 除 了 NT 和 Linux 机 器 以 外 ， 指 令 编 码 是 不 同 的 。 不 同 的 机 器 类 型 使 用 不 同 的 且 
不 兼容 的 指令 和 编码 方式 。 NT 和 Linux 机 器 使 用 的 都 是 Intel 处 理 器 ， 因 此 去 持 相同 的 机 器 级 指令 。 
然而 ， 一 般 而 党， 一 个 可 执行 的 NT 程序 和 一 个 Linux 程序 的 结构 是 不 同 的 ， 因 此 这 些 机 器 并 不 完 
全 是 二 进 制 裴 容 的 。 二 进 制 代码 很 少 能 企 不 同 机 器 和 操作 系统 组 合 之 间 移 植 。 

计算 机 系统 的 一 个 基本 概念 就 是 从 机 器 的 角度 来 看 ， 程 序 仅仅 只 是 衬 节 序列 。 机 器 没有 关于 原 
始 源 程 序 的 任何 信息 ， 除 了 可 能 有 些 用 来 帮助 调试 的 辅助 表 以 外 。 当 我 们 在 第 3 章 中 学 习 机 器 级 纺 
程 时 ， 将 更 清楚 地 了 解 这 一 点 。 


217 布尔 代数 和 环 

因为 二 进 制 值 是 计算 机 编码 、 存 储 和 操作 信息 的 核心 ， 所 以 围绕 数值 0 和 1 已 经 演化 出 了 丰富 
的 数学 知识 体系 ， 这 起 源 于 1850 年 左右 乔治 “布尔 【George Bode) 的 工作 ， 因 此 也 被 称 为 布尔 代 
$ (Bool aigebray。 布 尔 观察 到 通过 将 二 进 制 值 0 097139 HE TRUE. (A) 和 FALSE СЕ). 
能 常设 计 出 一 种 代数 ， 研 究 命题 逐 辑 的 属性 。 

存在 大 量 不 同 的 布尔 代数 ， 其 中 最 简单 的 是 定义 在 二 元 素 集 合 |0，1] 基 础 上 的 运算 。 图 2.6 
定义 了 这 种 布尔 代数 中 的 几 种 运算 。 我 们 用 来 表示 这 些 运 算 的 符号 是 和 CC 的 位 级 运算 使 用 的 符号 
相 匹 配 的 ， 这 些 将 在 后 面 讨论 到 。 布 尔 运算 ”对 应 于 迎 辑 运算 NOT， 在 命题 逻辑 中 表示 为 一 。 也 
就 是 说 ， 当 P 不 是 真 的 时 候 ， 我们 就 说 一 P 是 真 的 ， 反 之 亦 然 。 相 应 地 ， 当 P 等 于 时，P 了 等 于 
1， 反 之 亦 然 。 布 尔 运算 点 对 应 于 逻辑 运算 AND， 在 命题 逻辑 中 表示 为 入。 当 P ОЯЛА. 
我 们 说 PAO RY., ҚОЛА. НЕН, RAA pl Н а=1 М, p&g 才 等 于 1。 布尔 运算 | 对 应 
于 逻辑 运算 ОК, ЕТЕМ. ырайон. 我们 说 PVO ЖУ. ЖМ, 5 
р=1 或 者 gl Н, p| 9 等 于 1。 布尔 运算 “对 应 于 逻辑 运算 EXCLUSIVE-OR ( 异 或 )， 在 命题 逻辑 
中 表示 为 田 。 当 己 或 上 为 真 但 不 同 为 真 了 时， 我 们 说 Pe Q 成 立 , 相应 地 ， 当 p=1 Н а=0, 或 者 p=0 


R.a=1 t, p^g 等 于 1。 
- Е|0 1 0 1 10 1 
Q 11 010 Q оа 1 010 1 
110 110 1 1111 111 0 


26 布尔 代数 的 运算 
二 进 制 入 1 fil 0 EREB TRUE 或 者 FALSE, MERI Ee. | A kao PR W NOT. AND, OR #1 EXCLUSIVE-OR. 


后 来 创立 信息 理论 领域 的 Claude Shannon HAEE КИСЕ / ARER. (Ed 
1937 年 的 硕士 论文 中 ， 他 表明 了 布尔 代数 可 以 用 来 设计 和 分 析 机 电 继 电器 了 网络。 尽管 从 那 时 起 计算 
机 技术 已 经 取得 了 相当 的 发 展 ， 但 是 布尔 代数 仍然 在 数字 系统 的 设计 和 分 析 中 扮演 着 重要 的 角色 ， 

在 整数 运算 和 布尔 代数 之 间 有 许多 相似 点 , 同时 也 有 一 些 重要 前 不 同 之 处 。 特别 地 ， 束 数 集合 ， 
用 三 来 表示 ， 形 成 了 一 个 称 为 环 的 数据 结构 ， 表 示 为 <Z，+，x，-，0，1>， 其 中 加 法 为 及 和 运算 ， 
乘法 为 求 积 运算 ,， 负 号 作为 加 法 的 道 运算 , 而 元 素 0 和 1 作为 加 法 和 习 法 的 单位 元 ,布尔 代数 <{0,1)， 
l. &, `, 0, 1> 有 相似 的 属性 。 图 2.7 突出 了 黄种 结构 的 属性 , 展示 了 丙 者 的 共同 点 和 各 自 独特 的 属性 。 
一 个 重要 的 不 同 之 处 就 在 于 “a 不 是 a ЖИЕН КІНАЛЫ. 


ulbzhla 
| e xh g&hzbh&ku 
ЕЯ ТАЧ ІРІ ia са[е 
шхМксанкір же) [а & k) & c a n & ik г] 


а & (Ь| сү = {а & Б1| (п & c) 





tb trt 


жю [- —  — —- 


ñ K ú= au 





| ala = Ы 


z " њ = — ——= << жена 


alia&biza 
| aĝ alsa 


"Dana ai 
“ale” 447% 


图 2.7 整数 环 和 布尔 已 数 的 比较 
АНЕЕНЕНІНЕЛМЕИЕ. miti xam. EXES A XH. 


PE: ЕКШНП АНА 
AB RU ЕЧ ЗАТ ЖЕ] ЖА H ж Кн aka АН. Жи. рал; sa awa M 
und. -ЕКШЕЛЕы-ЕЖжаНМАЯ. Ы, B ië Y e lk H... мп. 
TA (Z. +. "a mw 01h ФЕНА ЕУ ЪТ, 
& = [UL] 
а+ьЬ =  ga*bmodn 
ax,b =  axbmodn 


k А а=0 
қ п-а,а>0 





пан - 


| DeMergan ЖҮР m 





E 
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WERNA EXCLUSIVE-OR 运算 来 取代 布尔 代数 中 的 OR 运算 ， 并 且 用 间 一 运算 l identity 

operation) {来 取代 补 运算 ， 这 里 对 于 所 有 的 a, jlaj= а, ЖЛ RTI SI A Да, 1). ` а, L 0, 

1]>。 这 个 结构 下 再 是 一 个 布尔 代数 ， 室 际 上 它 是 一 个 环 ， 它 能 被 杭 为 一 种 特别 简单 的 环 的 形式 ， 是 

BATES 1, =, т-р). ЕРЕ ЗЕЕ ИИ n 08. OE Гер, АНТЫ #=2。 也 

SIE. 布尔 AND 和 EXCLUSIVE-OR HAASTA 2 的 乘法 和 加 法 。 +k — АЕО НЕ 
就 是 ， 哲 个 元 素 屠 是 它 自己 的 加 法 道 元 ，a Haya. 


旁 注 ， 除 了 数学 家 ， 还 有 谁 甘心 布尔 环 ? 

ФА Ср iz Kee dr A d —& DVD ҮГҮТ КІ 
MERE, ЕНЗИМ ТА ана А к kasa, теала. ITI 
НЕЕ Б Ж KTA EW н ES adi! 


ZWEI gii Rx E. [oli E АЕ KN З wn od | 
ӘНІНЕ р H | & ИНИ ES b. Xy ЖН ПЕЙ. МШ, TETTE X [ai 
ger Us АЈБ, Б... “=, hana s а, В,» cns йы AFAR. | 和 “有 类 似 
EX. WO. IRON EE # [б Q. ixi f a" 3€ Hw SS a Жї. Ж 
么 你 能 看 到 得 到 这 样 的 代数 : <[0. IF |. &. `, 07, Mao 11, ^. &, L ғ, |>. + 
МЕТ АМА, H — MERI v WERT- ован МЕНЕЕ, 
жн. Ж: x — 807 3 i | 
ZAH 0, I]. ^. &, í 0, 1>8%4 di: - 
m, A IERS 044, de ER S MEC 35422174 














REFA. Штаб tent dE Hn kN. 


| ОТТОО ] 
[0101001] 





САИ РТА HEI HR RE RTM RS. Bm, ATES HG Bia... ---. а, а 
TEB TAE A С (0, L <<. wih Қфа-і НІШ ie А. ЮП. ! UGOTERTIER а. BETH. 
而 将 西 写 在 而 边 ), 我 们 有 a = (91010011965 fr А = (0,3, 5, 6б]. ЇЇ b= [01010101] E: f В = [0, 
2. 4, 6). ERREP. ЛЕЛ ROS TFC IE HERUE, ü I TaAR2 BN. Кї. E 
T. a&b ERU IS E ROTODOUQI]. ІП AnS = (0, 6). 

KEk. PEARES Ж (Gu, n. 0,5) ЖАТ-КтЕНЕ, Jih (Spo Br 
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SP fima, m 表示 集合 的 补 运算 符 , 也 就 是 说 , НЫНА, 它 的 补 提 就 是 焦 间 4 =la 
ESlad А). TERI MGE RO Ks mS ETE ІНІ), BER FR R МИРЕ. 
练习 是 2.9 


digg Z fFF Н] Ж, [ 红色 ， 归 和 色 和 昔 色 )， 计 算 机 在 视频 屏幕 或 者 沪 量 显示 器 上 产生 种 志 
HER. РАТЬ, Eme HARETAN, KMTIXMURE F. 
*® naus 





年 公 基于 光源 R MS) G (89) BOR) БАЙ CO) ANA (1), Sli ilt eod Ж 





F A. 
| AR a 
| Р | 
о 
ü 
| | E n 


ИЕНЕН АБНА ТАТНА. 
A, РЕБРА ЕЕ Т В.Е, ВТУ НЕДА Бла. ЖЕЗ УД 
5| d: dp F AR P 7 
B. STEP E, EDO S "sr ЖЕЛ EAT 
C. mut sl dk ë Emm yi aba m, 
& ё, | ir B - 
tEh а EHE 
М гё, ñ а Ё, 


п H 


218 СФ ЕИ 

C fF --gbfr АРЕ n КЕН ЗА W. WAK E. Ries ge ep em mue a 
ЧЕ С ЕН. MERE ОН, ӨЙ АМО, ИИ NOT, ТН EXCLUSIVE-OR。 这 些 运 算 能 
ЕЛІНЕН ЯЛЫ” ПИШЕ. ial. qois?) char 或 者 im 0 Edo. ХӘН 


fh doeet | 39 





short. long 或 者 unsigned АРЫЛЫ. DUF RE — Eee GR NI TF 





шанк 
` мах 


| 
| 
| I0110t001J1 1010101011 ШИТ | o | 
| 正如 我 们 的 示例 说 明 的 ， 确定 一 个 位 颖 副 达 或 的 结果 的 最 好 方法 就 是 将 十 六 进 刺 参数 扩展 成 筷 
们 的 二 进 制 表示 ， АЕ, ЕЕ rz. 
85210 ; е 
为 了 晨 示 “的 环 属性 的 用 姓 ， 考 虑 下 面 的 程序 ， 




















К 


| писа OS 
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| void inplace_swaplint *x, int *y) 
À 1 

3 "X = "X ту; /* Step ] */ 

4 "y * "x ep 2 */ 

5 "K = "X U түу; /4 Step 3 */ 


ё | 


Ез SERERE, FUTT dI SOR AE ET HE E E ode y 6 p Ана 
КЖЕ. ak, БИТИЕ МНН, ватан, ATTESA 
ЛЕВЕНТЕ ACE, Жарлы. 

таң, HE xe у RHET SMUHERHEUE Б), META, bud 
后 ,在 健在 这 两 钻 性 置 中 的 性， 利用 НДН ЖАМИ ИНИТ, шт, а 
МХЕЙТЕМЖЕЛ AREH, 27-0). 





hagi Wi АН RTB Rs PT, Е — 4H HER, 表示 内 一 个 字 中 选 出 的 一 
组 位 ,让 我 们 素 看 一 个 例子 , 接 码 ОРЕ С 最 低 有 效 几 位 为 Des — 1g UE rd 运算 x&0xPP 
主 感 一 个 由 工 的 最 低 有 效 字 节 姐 成 的 值 ， 而 其 他 的 字 节 就 被 置 为 了 0， 比 如 ， 财 于 0xgoABCDEP, 
шна ÜxIMNNKMUEF, WER O 将 生成 一 个 全 DERI, ХЕҢШЕРХАНЕФ. Б 
— Ë 32 (ir HLBS Fs HE dp Me d aT Е 0 DxFFFEFFFF, НЖАН ЕКЕН аны 9. 


ЕЗІМ211 E ^4 | pa- 3 


ККЕ ЕЙ, 14% т—0х98РГУЕСВА d 3 32 2 AE, Zu s 的 ках ре Еч 
ELETI Y | жы; 
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А.х CEA ЖАЙ, E4641) 3 ЦОхЕЕЕЕЕЕВА|. 

В.Х ЯК, F £ Р Н T [0x98FDECA45]. 

C, 除了 x 的 最 低 有 效 字 节 外 的 所 有 字 节 保持 不 蛮 ， 最 低 有 效 字 节 置 为 0[0x98FDEC00]. 
尽管 我 们 的 例子 假设 的 是 字 位 字 长 ， 但 是 体 的 代码 应 该 可 以 工作 在 w>8 的 任何 字 长 下 。 


练习 是 2.12 


从 加 世纪 70 -FARRA 80 E Digital Equipment 的 VAX 计算 机 是 一 种 非常 流行 的 机 型 ， 
它 没有 布尔 运算 AND 和 OR 指令 ， 它 只 有 bis 【位 设置 ) 9 bic (位 清除 ) 这 两 种 指令 ,两 种 指令 的 
输入 部 是 一 个 MEET KR MEA ТЕГ ЕРТЕ z. у АЛЫНЫ m ABARCA 
得 到 的 。 使 用 bis 指令 ， 这 种 修改 就 是 在 m 为 1 的 每 个 位 置 ， RES 1. 使 用 beie, ЖӘНЕ 
改 就 是 在 m 为 0 的 每 个 位 置 ， 将 z 设 置 为 0. 

КПЗЕБЕСЕ bis 和 bic 来 计 和 其 这 两 个 指令 的 效果 ， EA C 的 位 级 运 其 ， 填 写 下 列 代 码 
中 据 失 的 表达 式 ， 


/* Ви Set */ 
me bisiint x, int m! 


f+ Write an expression in C that computes the effect of bit set */ 
int result = 
return resul-; 

| 

/* Bit Clear */ 

int bicíint x, inz m) 

| 

L 
[* Write an expression in C that computes the effect of bit clear */ 
int result = 
return resul:; 


| 


2.1.9 C 中 的 逻辑 运算 

C 壕 提供 了 一 系列 的 还 辑 运 算 符 |、 太 到 和 1， 分 别 对 应 于 命题 逻辑 中 的 OR. AND 利 NOT 运算 。 
漫 辑 运算 很 容易 和 位 级 运算 相 混淆 ， 但 是 它们 的 功能 是 完全 不 同 的 。 逮 辑 运算 认为 所 有 韭 零 的 参数 
WEN TRUE, ПФ KOR FALSE, CIRH REO SARRERA TRUE 4X FALSE. 
КЕ HEX OKB IU S): 





信息 的 表示 和 处 理 4! 


"ПЖ. Rire WE АЗЕКЕН. CIE ROERURUS 0 或 者 185. PR Sen s 
PERTANT A. 

IW NER GRIS ENTRE Е SEA AA — PREISE RE, RAR 
атала R, ALPE OE NE MUI UR pR 因此， 恒 如 ， 表 达 式 aita 
HERRER, TAER меры LU RHET н. 

38213 3 


Fik x de y FILTER] 5 (066 和 0x93, ASTA, fic kša K ЖҮ. 





ЭШ 2.14 | REI p cu roe 


XAR GALE MGE E. |E— CARA, ЕФ хе ну. RAAN dreyft 
МЖ |, ФИН 0. 


2110 CC 中 的 称 位 运算 

还 提供 了 一 系列 的 物华 运算 ， 以 向 堪 或 者 向 右 穆 动 位 模式 。 对 于 一 店 位 表 示 为 中 nsns 
ха] Ex. СИЕЗ сек ЕЕ РЧ, Е ЦА, ао xa қ, O. o, OL BE 
IE. x n Bas kfr, ЖЖ КАЖ. НЕБАТ АТО. АЕ t 0—п-1 之 间 的 
їй. ЖЕНИТЕ а. КЩ rejec Wir Fiege. HEARRE: 15-1 应 读 
ЕШ 1225-1) f Ң1<<5)-1 ЖКА. 

H—TA ERE ERENE x s> k. (lE DU ЕШЮ. Fg. ИШЕН ЕЖЕЛИ. 
EH RE Xa. ЖЕТЕЛИК EO. ЖШШЕ ИЛО, +. 0, xe xc x). ЕЖЕ 
JE d fo КЕННЕН, PERIERE RES, o noa nop xac X|. ЖЕЕ 
Жи Н М, BERUZEAUCHÉHSOENRERH EHISAETHE. 

C bat h ti SH B E A A ЕН ЖАН. 对 于 无 符号 数据 (也 就 是 , ШШЕ] unsigned 
PEE NS, АЖЕН. ШИНЕ ЕЕ СНА), ЖЫНЫ КЫ таты, 
ЖаН, ЙКЕ EC uir n E BEGCSICEHEB ЕН ӘНИ тн. ЖІП, 
寥 际 上 ,， 几 乎 所 有 的 编 评 器 /机 器 组 间 者 对 有 符号 数据 使 用 算术 右 称 ， 上 且 许 老 程 序 员 也 都 假设 使 用 这 
Еж. 


4 ЗІК 215 iic ач, қамыты. 


A ETE. Жаб JE S cH MU. PPETI ETE 
ЖА, PREHRA SAH, AH, &eSRMEHR m+. ЕКЖЕЖЕНЕ 
ҚЫ ТАЖ T> #®ЫК+. 
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eag х>>2 х>>2 
СОВУ) (算术 的 ; 





2.2 整数 表示 


仕 本 节 中 ， 我 们 描述 用 位 来 编码 整数 的 两 种 不 同 的 方式 ， 一 种 只 能 才 杰 非 负数 ， 而 只“ 种 能 够 
“АЖ, FACA. ЕНЕ Жа ТЕПЕ ЖЕН ЛАНА ЗЫН ТИНЕ АЕ. RET] 
VE REALE НЕН TORBEK LOEN НК АН. 


22. 整 型 数据 类 型 

C 女 持 多 种 整 型 数据 类 型 一 一 表 沙 有 限 狗 围 的 整数 。 这 些 类 型 如 图 2.8 所 示 。 每 种 类 型 都 有 一 
个 大 小 指示 符 : char. short. int 和 long， 占 时 还 有 有 被 表示 的 数字 是 卡 负 数 《 声 明 为 unsigned), 或 者 
НЕЕ 01 30 СӘЛА) МЕТ. 图 22 中 给 出 了 对 这 些 不 同 的 大 小 的 契 噶 分 配 。 如 图 28 所 水 ， 这 些 
ARRA RITET TAWA. C 标准 定 叉 了 每 种 数据 类 型 必须 能 够 表示 的 最 小 数值 范围 。 如 
图 中 所 示 ， 朋 然 C 标准 允许 16 和 位 的 表示 ， 和 但 一 个 典型 的 32 位 机 器 司 用 -个 32 位 表示 来 袁 示 int 和 
unsigned 数据 类 型 。 像 图 2.2 所 描述 的 ，Compaq Alpha 使 用 64 177 Жу long ЕЖ, RERO 
上 上限 超过 了 1.8410 “， 而 有 符号 数 的 范围 超过 了 49.22x 107, 





和 典型 32 性 机 器 


char 


unsigned char 


short [int] -32 767 32 767 -32 768 32 767 
unsigned shert [int] ij 63535 {) 63 535 
int -32 767 33 761 -2 |47 483 648 2 147 483 647 
unsignea[:nt] 0 65 535 () 4 294 967 295 
long[int] -2 147 483 647 2 |47 483 647 -2 147 483 648 2147 483 647 
üansigned lorg[irt: 0 4 294 967 295 ( £ 294 967 295 


#28 人 的 整 型 数据 类 型 





Mh rn yE EH A 0, 


给 C SSS. C. CM Java 中 的 有 符号 和 无 符号 教 
С 和 C++ 都 支持 有 符号 【默认 ) вАЯҒЖ, Java EX He M EK 


TERETERE | 43 





222 无 罕 号 和 二 进 制 补 码 编码 

ERA- TERRENA w 位 。 我 们 可 以 将 位 向 量 写 成 了 . OR PER. HORTUS, 
ын, 次 平 问 量 中 的 督 一 位 。 把 寺 看 做 一 个 写成 二 进 制 表示 的 数 ， 胞 们 就 获得 了 总 的 无 符号 
Sos. RUDI AR 肥 以 【代表 “无 符号 的 二 进 制 "， 长 座 为 w) ЖАНЕ: 


ҥ = | 
B2U (De % x2 (2.1) 


ТАК, FPS “а” ЖЕШЕТ ЕТШ. HUE EU, THEE w [Йй 0. 
ЕЕЕ T ЕШ. oH AERAR- otr. ӘЖЕ ЧЧ 
1 Щ111]# к. ЕЖЕ Н има, * 9,2 22" -1, БІН, BM B2U. Б MESE 33 — B 
射 820,40, 1-40, 27-1]. 注意 B2U, 2 — 1-54 ——31 T E КЕНІ w 的 位 向 量 ， 都 有 
Е Н T XE. DX. dEO-2"-10 НАК KES — 0E P Rcg w 的 位 向 量 
二 进 制 表示 与 之 对 度 ， 

对 十 计 事 度 用 。 我 们 还 希望 表示 人 负数 恰 。 最 需 见 的 有 符号 数 的 计算 机 表示 方式 就 是 二 进 制 补 到 
(two's-complement) ЖА. Thy ИКЕЛЕ АГЕН ИНЕ НЫЛ Сперміуе weigh). RIMAN 
ВЛ, (or. " НЫҢ НН". ЕШ Л н) 康 表 示 这 种 解释 ， 


ВОТ, (x) = 一 IET «S aol (22) 
i=} 

IA RA INNER 【siga Би), ERN IN, # lh. mt END О, (ІЗ 
TERR. ЖЕ Жок RH P CIE егт] Cie. HO e. {ЧЕЖЕ ОНЕГИН). 
КЕЕ TMin, 2-27, RICHIE GL BRI), ЖИЫ ТМах = Y "72 227 -1, 
同样 地 ， 我 们 可 以 看 到 027, 61 — 10904. Bucii 1]*--[-27, -, 2*'-1], Fu Ag RS 
ENT r k RI — НЕ JW SIE, 

мы ле ТРИ ИЕНА 


假设 wed, KDRRREA TIU -TIHEHRTNT HE JUR LES A il 
шіт, Rd DEA T, МОЖЕ КО 228 cH Es Ф НЕФ. МЕТА, 








图 29 展示 了 咎 同 字 长 的 儿 个 “有 让 的 ”数字 的 位 模式 和 数值 。 前 三 个 给 出 的 是 可 表示 的 整数 的 
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mB. 有 几 扩 全 得 注意 。 3. LP НЫН EP АЖЕН. ІГМіл = (Мах, + 1, 816, TMin, 
НАМЕ ПЕ. ИЙИП 308], REAT НИЕНІ ЖЕК КШТ. ЖАЗЫ 
BRA. TEIL. 最 人 的 无 符号 值 刚好 北 二 进 制 补 介 的 最 大 值 的 其 倍 大 一 点 ，UMax, = 2 
ТМах„+ ]。 这 是 因为 二 进 制 补 人 码 天 小 保留 了 一 羊 的 位 模式 米 表 小 负数 值 。 其 他 的 情况 是 胡 数 -1 RIO. 
注意 -| 和 UMax,, 有 同样 的 位 表示 一 一 -个 全 1 的 串 。 数 值 0 在 两 种 表示 方式 中 前 是 全 0 的 帅 。 


а | 6 | 
От 
















e | | 
UM UxFF ÜxFFFF DxFFFFFFFF ÜxFFFFFFFFFFFFFFFF 
м 245 65 535 4 294 967 295 1$ 446 744 073 709 551 615 
ТМ "T аҰ?ҒЕРЕ Üx'rTFFFFFF Üx'FEFFFFFFFFFFFFF 
1 ix, 
127 32 767 > 147 483 647 9223 372 036 854 775 M07 
"n Охйй Охвсоо 080000009 бх8090000000000000 
МП. 
UN -128 -32 768 -2 147 483 648 9223 372 (36 854 775 806 
ЖЕГЕН o ЕГІ ТІП ТТТ 


29 “有 趣 的 ”数字 








edi S ACFA | АЖ Ыл. 


САКИ ж КЕЛ HRIH АЖ ST SEN. BIEILDBUBIIBLS AS АДА АҚ 
的 。 为 了 保证 代码 的 可 萝 植 性， 除了 图 22 PF ses 28, RIA RAI Ea nA aq 
Еа, mikur lens. C 库 中 的 文件 <limits.h> 定 头 了 一 组 常量 ， 米 限定 运行 编 洋 器 
的 这 容 机 器 的 不 同 整 型 数据 类 型 的 范围 ,比如 , Е ХГ Е ІМТ МАХ. INT, MIN Я UINT MAX, 
它们 描述 了 有 符号 和 无 符号 整数 的 范围 对 于 一 个 二 进 制 补 码 的 机 器 ， 数 据 类 型 inf we 位 ， 这 些 
AAMT ТМах,. TMin, ЖІ UMax, - 


Sit. WNSENIUERAX 
有 符号 数 和 另外 还 有 两 种 标准 的 表示 方法 ; 
二 进 制 反 码 (Ones' Complement， 又 译作 “一 的 补 码 " )， 这 和 二 进 制 补 码 是 一 至 的 ， 除 了 最 高 
有 效 位 的 权 是 -(2” 一 ]) 而 不 是 -2*1， 
wd 
B20,(3X) 5 -x, AQ" 1-1) Уа 
"E 


符号 数值 (Sign-Magnitude )， 最 高 有 歼 位 是 符号 位 ， 确 定 翻 十 的 位 应 该 取 负 权 还 是 正 权 : 


x) 


iz 

这 两 种 表示 方法 都 有 一 个 古怪 的 属性 ， 那 就 是 对 于 数字 昌 有 两 种 不 同 的 编码 方式 ， 对 于 两 种 表 
TAE. B0.0 t EHE a0, MEO 在 符号 量 形 式 中 表示 为 10.…. 们 ， 而 在 二 进 制 反 码 中 表示 为 
[1...1]. & Aide 5 DET —db8 E doxes. 但 是 志平 所 有 的 现代 机 器 都 使用 二 进 制 补 码 ， 
8413443835 308 4852: 80 0 k sb. 


В25 „(Ху * (-1)!€ - 





I Лр EE TI 4 4% 





B. жөндеген ӨЗ gat eis I cuu ir “ым 
伟 为 一 个 示例 ， 考 虑 下 面 的 代码 ; 
Bhort int x = 12345; 


short int mx = -xj 


Show bytes|ibyte pointer) Ах, sizeof short intil: 


1 
2 
3 
4 
3 show Бүтені(Буге pointer) &mx, sizeof(ahort intl): 


12 345 


x | 
. | 
| 





Ш 210 12345 30-12 345 [6 rU, ИЛ 53171 的 无 特 号 表示 
its GUB TB imat Жл. 


当天 行 在 大 端 法 机 器 上 时 , 这 段 代 码 的 输出 为 30 39 I cf c7, 指明 x HAET 083099, 
її mx 的 十 让 进 制 表示 为 0xCRC7. 圭 它们 展开 为 二 进 制 ,我 们 得 到 x 的 位 模式 为 [O011000000111001]， 


而 mx 的 位 模 臣 为 [1100111111000111]。 SL BR 2.10 所 示 ， 等 式 212 对 这 两 沾 位 8t ^E ge NL 12345 
91-12 345. 





RUP ws norm Қы GT REG rm іе Abr qo 

&Eif9. PPE TEPE EE E R.T R EG — rik T Ik ft x takik 
Daiki ASCI EH K dE, ИЕН ВФ Бл. R Ab uE E| — it lika x 
Ж. Ж. жй, Ri mid НИЕ (ss. ENEAS AS) А-ЯЖж 
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在 下 面 的 列表 中 ， 对 于 标号 为 和 ~ 民 (标记 在 右边 】 的 那些 行 ， 将 指令 名 (sub. push. mov 和 
add) 右边 显示 的 十 六 进 制 值 转换 为 它们 的 十 进 制 等 价值 ， 


BId483b7; 81 ec 84 01 00 00 sub SUxl184,&esp А. 
BJ483bd: 53 push tebr 

80483Те: 8b 55 68 tow xš (%ebp),*edx B. 
82483с1: Bb Ба бс mov бхсіЗерр),Жерх C. 
82483с4: b 4а 10 TOV Ux1Ji%ebp),%ecx D. 
Н0483с7: Bb 85 94 fe ІР ТЇ mov Ux£fFrfffeB931%ebpi,teax Е 
8)183cd: 01 cb add $ecx,tebx 

H)dg3cf: 03 42 10 add Uxly {Bedx) ,Seax F. 
81483422: 89 85 ай fe ff ff mov $cax,Ü0xfffffeaD($*ebp) G. 
80482428: 8b 85 10 ff ff ҒҒ тоу ÜxfffffflÜüi€*eopl,€teax H. 
ag4B3de: 89 42 lc mov Seax, Oxlc (Фейх) Í. 
8048зе1: 89 9d Тс ff ІР Ff mov $ebx,ÜüxrffIrf?7cí(&ebp) J. 
ВЈ48Је7: Bb 42 18 iov 0x18 (%edx) ,%eax K. 


223 ”有 符号 数 和 无 符号 数 之 间 的 转换 

БЕХ B2U, RI ВОТ, 都 是 双 射 ， 它 们 就 有 定义 明确 的 逆 映 射 。 将 U2B. XE XL B2U, , ПЖ T2B, 
EXA BT, 。 这 些 随 数 给 出 了 一 个 数 们 的 无 符号 或 者 一 进 制 补 码 前 位 模式 。 给 定 0<x< 2 范围 内 
ВУ x, ра U2B, 00:88 х EE B w (EE S OR. НИНЕ, Ex d lex <2" i， 
MS T2B, (x) ЕН x FOE BJ w 位 二进制 补 码 表示 。 可 观察 到 ， 对 于 范围 0 Sx «2" 内 的 值 ， 这 
PT 6334 E НЙН hi k— tt E 0， 因 此 这 个 位 是 正 权 还 是 负 权 就 没有 关系 了 。 

考虑 函数 U2T,(x) = BT (UB (x) ， 其 输入 是 一 个 0-2"-1 之 间 前 值 ， 得 到 -个 -2 一 入 -1 
之 则 的 值 ， 这 里 状 个 数 有 由 同 的 位 模式 ， 除 了 参数 是 无 罕 号 的 ， 而 结果 是 以 二 进 制 补 码 表 示 的 。 相 反 
Ші, EE T2U (x) = В207,(Т2В, (生成 一 个 无 符号 数 ， 它 和 Y 的 二 进 制 补 码 值 有 相同 的 位 表示 。 例 
如 ,如 图 2.10 所 六,-12 345 的 16 位 二 进 制 补 码 表 示 就 和 191 的 16 位 无 符号 表示 相同 .因此 ,72 忆 1 
345) = 53 191, JE H UZT (53 191) = -12 345. 

这 天 个 前 数 看 十 去 好 象 只 有 理论 价 从 ， 但 实际 上 它们 有 非常 太 的 实际 意义 一 一 它们 形式 化 地 定 
羡 了 CC 中 有 符号 和 无 符号 信之 间 的 强制 类 型 转换 的 结果 。 例如， 设想 在 一 台 二 进 制 补 码 村 器 二 执行 
PAIS. 

l int x = -1: 

2 unsigned ux = (unsigned) x: 

因为 从 图 2.9 中 我 们 可 以 看 到 -1 的 w 位 二 进 制 补 码 表 水 和 UMax 有 相同 的 位 表示 ,所 以 这 段 代 
码 将 把 ux 设置 为 VMax,， 其 中 w 是 数据 类 型 nt 中 的 位 数 , mne. A DARSI х 强制 类 型 
转换 到 无 符号 数值 unsigned) x 就 相当 于 应 用 哨 数 Т). ЗАН ЕЖ 
只 是 改变 了 如 何 将 这 些 位 解释 为 个 数字 。 相 似 地 ， 从 无 符号 值 u 强制 类 型 转换 到 有 符号 值 (tintyu 
ЖУА 5 РЛ 35 UZT. 


ЖУН 2.18 
ПАИ AE ЯВ 216 MR E 5 ЕҢ. ЖБ Рё Р, S] d 
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B2UA ВТ 3) 2,27 2) x 2. AXI XK; MUL = л, 42" +В2ТА з}. 如 果 
ПШ кенті: Eid 
BIUQT2B, (x) = T2U, (X) = x, + z (23) 
UTOR BOUT UEHI XE RU b BUM Ri NC X CRAT FEL. ох 的 二 进 制 补 码 表示 
T. trao ЖЕТ ЙА, MR 


ur xe) 


TU дк) s | (24) 
Ман) s И xÜ 


211 dg ТА TUNTA. ШЕНИЕ, HET ME SB AE Hu Gd 8 
tu, СА ГСВ, тїй, 





#211 具 二 进 制 补 码 到 无 符号 笋 的 转换 
ШЕТЕН SANER. 

































Жалал 24 Жї n S k a g3Eq DSG 185 + РЕ егор 


民 设 来 看 ， 我 们 硕 望 推导 出 一 个 无 罕 号 数 x 和 与 之 对 应 的 有 符号 数 U2T, (z) ПЖ. Wan 
Bi те Ат). SOLA 
BPTIU2B.x) = UIA) = -ri + r (2.5) 
fE xf Ө Жер. ru RET: БАТЫР, maj 
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X, x«2*! 
U2T (x) = (2,6) 
x-2", x22" 
图 2.12 88H Fux fp А. ЖҒК (2271), AL ERES SISTIESmESO RAA TRIE 
对 于 太 的 数 《>2”')， 数 字 将 被 转换 为 一 个 负数 值 ， 


2" T 


а 
клет scs 0% кре 





ol 0 сн 


图 2.12 M KA= H XE BUS S 
mE 02T 把 人 于 2 -| 的 数字 转换 为 负 值 ， 


为 了 已 绪 一 下 ， 我 们 可 以 攻 忠 无 符 旨 与 一 进 制 补 码 表示 之 间 互 相 转 换 的 结果 。， 对 于 在 范围 
€«x«2"! 之 内 的 值 而 言 ， 我 们 得 到 T2U (у= x 和 U2T (tr) =x。 也 就 是 说 ， 在 这 个 范围 内 的 数字 
有 相同 的 无 得 号 和 一 进 制 补 友 表 示 。 对 于 这 个 友 围 以 外 的 数值 ， 转 换 需 要 加 上 或 者 减 去 2". А 
如 ， 我 们 有 T2U, (-1) = 负数 映射 为 最 大 的 无 符号 数 。 在 为 一 
极端 ,我 们 可 以 看 到 720, (TMin,) 2-2" + 和 22" = TMax, + 1—— ИЙЛЕ A жы 
(ЕСЕМ TIENE BLZ РСЕ 53. ЯН 2.10 的 示例 ， 我 们 能 看 到 TIU 12345) = 的 
563 + -12 345 = 53 191. 


224 《中 的 有 符号 与 无 符号 数 

如 图 2.8 所 示 , C 支持 所 有 穆 型 数据 类 型 的 有 符号 各 无 符号 运算 。 尽管 C 标准 没有 指定 某 种 有 
符号 数 的 表示 ， 但 是 刀 乎 所 有 的 机 器 部 使 用 一 进 制 补 码 。 通 常 ， 大 多 数 数字 默认 都 是 有 符号 的 。 
АЛ, SÆ- PER 12345 或 者 OX LAZB 这 样 的 常量 时 ， 这 个 值 就 被 汰 为 是 有 符号 的 。 要 创建 一 个 
Хара, Un ЕЕ “0” SS “а? ООП, 123450 或 者 0x1A2Bu )。 

C W S SORS TES ЕНЕ. 原则 是 基本 的 位 表示 保持 不 变 。 К, = 
补 但 机 器 上 ， 当 从 万 符号 数 转 换 汶 有 符号 数 时 ， 效 果 就 是 应 用 两 数 027.， 记 从 有 符号 数 转 换 为 无 
符号 数 时 ， 就 是 应 用 函数 TNU. Кт» 表示 数据 类 型 的 位 数 。 

显 式 的 强制 类 卉 转换 将 导致 转换 的 发 由 ， 就 像 下 面 的 代码 ; 








int tx, ty; 
unsigned ux, uy; 


(185) ux; 
(unsigred) ty; 

45b. Dp ЖЕТЕ ХОК {ҢА я SNC ROSTER EH. а N EB, XR ЕШ 
my. 

1 int EX, ty; 

à unsigned ux, uy; 


1 
2 
i 
4 
2 


= 
be 
H ll 
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3 
4 tx = ux; /* Castto signed */ 
D ty; Р Cast to unsigned */ 


uy 


ЭШ printf OX Srt Set f, а. Фи 9х 分 别 用 来 以 有 符 呈 十进制、 无 符号 十 进 制 和 
ГАН ORA СТЖК. ЖЕ printf 洪 有 人 司 用 任何 类 型 信息 ， 所 以 它 可 以 用 指示 符 多 0 ЖЕЙ 
出 其 型 int ІЗДЕ, tB alti Sd 输出 类 型 unsigned ИЕ. Ps. EET mm feed: 

] int x = -i: 


unsigned u = 2147483548; /* 2 to the 318: */ 


4 printfi"x = $u = охл", X, Xh; 

5 printfi"u = % = d\n", u, ub; 

SE M324 Ба, ЕКІНІШІ F: 

x = 4294957295 = -] 

u = 214У443БА8 = -2147483643 

ERARA, printf HUE TEXT TAE ЙН. А ЧЕГА SORT 
出 。 我们 可 以 看 看 实际 运行 中 的 转换 函数 ，T2Uy(-1) = UMax = 4 294 967 295 31 U2T402) = 27 — 
272 Y = TMin;. 

AF C 对 同时 包含 有 符号 和 无 符号 数 的 表达 式 的 处 理 方式 ， 出 现 了 一 些 奇特 的 行为 。 当 执行 
个 运算 时 ， 如 果 它 的 一 个 运算 数 是 有 符号 的 而 另 一 个 是 无 符号 的 ， 规 么 C Ee BS 
煞 强 制 类 榭 转换 为 交 符 写 数 ， 并 假设 这 两 个 数 都 是 非 仙 的 ， 来 执行 这 个 运算 。 就 你 我 们 会 有 到 内 ， 
这 种 方法 对 于 标准 的 算术 运算 米 说 并 无 多 大 差 踢 ， 介 是 对 于 像 < 和 > 这 样 的 关系 运算 得 米 说 ， 它 会 
PEL НАТАН Ж. 9 2.13 展示 了 ЕХ АЛАНИН АН К, 
假设 使 用 的 是 са 32 和 位 机 器 和 二 进 制 补 友 表示。 与 直觉 椒 相符 的 情况 用 “*” 标 出 来 了。 考虑 一 
比较 式 -1<0U。 内 为 第 二 个 运算 数 是 无 符号 前 ， 所 以 第 一 个 运算 数 就 会 隐 合 地 转换 为 无 符号 数 ， 
AERA в Е 42949672950<00 (回想 -下 T2U C71) = UMax,)， 这 个 答案 显然 是 错 的 。 男 
APARER E n] Б АННА 2 o E e 


-1 « DU 
814740354! > -Zzl4/483547 ` 
2là7?74Bi64j7U] > -2147483647-1 


2147463647 > iint! 21474836487; 
- > -2 


unsigned) -` > 





E213 给 位 机 器 上 CC 的 升级 规则 (promotion гле) 的 效果 
非 日 现 的 情况 被 标注 六 "t". SIP ЕЛАН {Т - 运 稼 数 是 无 符号 的 时 人 筷 ， 田 - -人 沾 运算 车 也 被 隐 式 强制 转 模 为 巨 符 入 让 
Сн, АН Е А, ТЁЗ ТМіп 32 7;2)-2147483647-1, T3 2472483648, Ж ЕЖЕ THE -X ИЕК, 
ВЛАДЕ А А ДХ, алы. j: k 21473836418 本 大 了 ， 不 能 表示 为 tam. : 进 制 社 倘 的 数 ， 
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ЖУ 2.20 
Е рдЕ W b) 32404 ЕРЕ ЈА КЛА, ERE 2.13 АА. ЖБ ЕЛ. 


描述 强制 类 型 转 撞 和 关系 运算 的 结果 ， 






-2147483648 == 21474936431] 


-2147483648 < -21474636497 






225 扩展 一 个 数字 的 位 表示 

一 个 常见 的 运算 是 在 不 同 字 长 的 整数 之 间 转 换 ， 同 时 又 保持 数值 不 变 。 当 然 ， 当 日 标 数据 美 
型 太 小 了 ， 以 至 于 不 能 表示 概要 的 值 时 ， 这 可 能 根本 就 是 不 可 能 的 。 然 而 ， 从 一 个 较 小 的 数据 类 
型 转换 到 : -个 较 大 的 类 型 ， 应 该 总 是 可 能 的 。 要 将 一 个 无 符号 数 转 换 为 QA A u 我 
i: НЕШЕ RETOUR 0。 这 种 运算 被 称 为 零 扩 上 (zero extension)。 要 将 一 -个 一 进 制 补 
BAFRA -个 更 大 的 数据 类 型 ， 规 则 是 执行 一 个 符号 扩展 sign extension), Марији 
而 有 效 位 的 值 。 因 此 , ЖЖАП АЕА ОУ RR Don xe] ЖД ВЕ RRRA [ent 
Хы» Tals Дыт, 77» јә 


例如 ， 考 虑 下 面 的 代码 


1 short sx = val; ж -12345 */ 

2 unsigned short usx = ах; ж 5319] */ 

3 int x = sx; 1+ -12345 */ 

4 unsigned ux = ux; i* 53191 */ 

5 

6 printf["sx = &d:it", sx); 

7 show bytesí((byLe pointer) &sx, sizeotishort)); 

8 printfí"usx = $u:\t", usx'; 

9 show byLesl(byte pointer) usx, sizeof {unsigned shorti}: 


19 printf("x = %d:Nt", x); 

11 show bytes((byte pointer) kx, sizeof(int]); 

12 printfí"ux = $&u:Xt', ux); 

13 show Dytesi!byte pointer) &ux, sizeofiunsigned)); 


在 使 用 二 进 制 补 码 表示 的 32 бу ХНЕНЫ ІНЕН, RESTE d A pH: 


Sx = -12345: cf c7 
usx = 52191: cf с? 
x = -12345: ff ff cf с? 
их = 53191: ОП 0D cf c7 
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我 们 看 到 ， 尽 管 -12 345 的 二 进 制 补 玛 表示 和 53 191 的 无 符号 表示 在 16 位 字 长 时 是 相同 的 ， 
但 是 在 32 (Eg Em a RORIS. MEER, 32 345 的 1 六 进 制 表 示 为 OxFFFFCFC7, ІП 53 191 的 
十 六 进 制 表示 为 0x0000CFC7。 前 者 使 用 的 是 符号 扩展 一 一 16 个 最 高 有 效 位 1， 表 下 为 十 六 进 制 就 
是 0xFFFF， 被 加 作 于 头 的 位 。 后 者 使 用 16 个 0 来 扩展 ， 表 示 为 十 六 进 制 就 是 Ox0000. 

我 们 如 行 证 所 符 号 扩展 工作 得 正确 呢 ? RARUA E BAIT, (Ix, Ay D Xue X, 2977 
о) = DB270 5, 99 д), 这里， 在 走 手 边 的 表达 式 中 ， 我 们 增加 了 天 人 位 一 的 副本 。 
证 明 是 对 大 进行 归纳 。 也 就 是 说 ， 如 果 我 们 能 够 证 明 符号 扩 最 一 位 保持 了 数值 不 变 ， 那 么 符号 扩展 
任意 位 都 能 保持 这 种 属性 。 央 此 ， 证 时 的 任务 就 变 为 了 ， 


B2T, 1,0 Ue Жу-р+ Жусу; A 0773 х) - В2Т, D-i? ,-2 7n хо)) 


H3 2.2 展开 左 于 演 的 表达 式 ， 会 得 到 ， 





н-і 
В2Т, (1-р Қр С» К) = ay 42" +} a 
=й 


ҥ>-2 
__ w wl ! 
реф) 


w 
= 10" -27) У x2 
151) 


н--2 | 
EE Qr i 
= 1,42 +) x2 

I-0 


= BIT x, халаты ду) 

我 们 使 用 的 关键 属性 是 -2 + 2” 2-27. 因此 , 如 上 一 个 权 值 为 -2 的 位 和 将 -个 权 值 为 -2 
的 位 转换 为 一 个 权 值 为 ”的 位 ， 两 项 运算 的 综合 效果 就 会 保持 原始 的 数 代 。 

值得 一 提 的 尾 ， 从 一 个 数据 大 小 到 男 一 个 数据 大小 ， 以 及 无 符号 和 有 符号 数字 之 间 的 转换 的 
相对 着 序 能 够 影响 一 个 程序 的 行为 。 考 虑 我们 前 面 那个 重子 的 如 下 额外 并 码 ， 


unsigned Ly = х; #* Mystery! */ 


| 

2 

3 printii"uy = *u:St", uy); 

4 show bytes(i(byte pointer) kuy, sizeofíunsignedl); 
这 部 分 代码 产生 如 下 输出 ， 

uy = 429485455]: ff ff cf с? 

这 表明 表达 式 ; 

(unsigned) (int) sx {* 4294054951 */ 

和 

(unsigned] (unsigned short) sx Ре 53191 */ 


产生 了 不 同 的 数值 ， 即 使 原始 的 和 最 后 的 数据 类 型 是 相同 的 、 在 前 一 个 表达 式 中 ， 我 们 首先 将 16 
МІН short 符号 扩展 为 辽 位 的 int， 而 在 后 一 个 表达 式 中 执行 的 则 是 每 扩 展 。 
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ЖЫН 2.21 
HETEC АЖ. 


inb funi[unsigred word) 
{ 
return (int) ((word << 24] >> 24); 
} 
int fun2íunsigned word) 
l 
return (llnt) word << 24} >> 24; 


) 


假设 在 一 个 使 用 二 进 制 补 三 活 算 的 32 位 宇 长 的 机 器 上 执行 这 些 函 数 , 还 假设 有 符号 数值 的 右 移 
是 血 术 在 黎 、 而 无 符号 数值 的 右 移 是 这 辑 右 移 ， 
A Ph TOR, АҢЫ АЙЫЛ, КАНЫ. 


w tun] (w) 





B, HEX AER drm mer, 


226 ЖТ 

很 没 不 用 额外 的 位 来 扩展 一 个 数值 ， 我 们 会 减少 表示 一 个 数字 的 位 数 。 例 如 在 下 面 的 代码 中 
SURE TIGER. 

l int x = 53191; 

à Short sx = (short) x; 产 -12345 */ 

3 int y = SX; /*-12345 */ 


企 一 台 典 型 的 32 位 机 器 上 ， 当 我 们 把 x 强制 类 型 转换 为 short 时 ， 我 们 就 将 32 位 的 inc RE 
为 了 16 位 的 short mt。 就 像 我 们 前 面 所 看 到 的 ， 这 个 16 位 的 模式 就 是 -]2 345 ЫМ А. 
当 我 们 把 它 强 制 类 型 转换 轩 int 时 ,符号 扩展 把 高 16 位 设置 为 ]， 从 而 生成 -12 345 的 32 E ЗЕН 
IBER- 

当 将 一 个 w BEP xa na, ERRAUS КСЕ, BILER N wk, SLA 
—^ hi р хро", zo]。 截 断 一 -个 数字 可 能 会 改变 它 的 值 一 一 溢出 的 一 种 形式 。 我们 现在 来 
研究 ~- 上 什么 数值 将 产生 这 种 情况 。 对 于 一 个 雹 符号 数字 +， 截断 它 到 大 位 的 结果 就 相当 于 计算 x 
mod 2 。 通 过 点 用 模 运算 到 等 式 2.1 就 可 以 看 到 ， 
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B2U [х,ое D mod 2° = 





ж-1 | 
Уло а Т 


Lis 


kI 
= ул [mar 
m: 


由 =] 
= Ул? 
ізі) 
- BAU [x th ла 


(ARIES. RÉIAIST MEE: RETAER PK 2 mod 20 89, 2259, 2 -2'-1«2*, 


对 于 一 个 二 进 制 补 码 数字 x， 相 羽 的 推理 表明 IT, (л, css а) mod 2* = BU na. 
mj. ЕЖ, x mod 2 能 够 被 一 个 位 组 表示 为 [ty ЫН ЖЕНЕ. Жи, OBS. BU 
梅 截断 的 数字 视 为 有 和 社 号 的 。 这 将 得 到 数值 Uir mod 25. 

WT. ШЕШЕ КТ: 

ЕЛІ [x Ха, x9] = B2U, [ie x... ла) mod 2“ (27) 
B2T, [sy быс”, xa] = U2T, (БТ, Qa, aoo, ж) mod 2) (2.3) 
KIE 2.22 | | 


RRAN- AARE CR eil F K+) MORE Ld dile (АҒЫНЫ 


0—7 А). HETA НЕЕ {ЕИ AM LEER UEM HA A Р. ииий Ж НИ, 
eux, 





LEE 1*1 lx T 
MICE A 273028 AE ЕНИ, 
227 关于 有 符号 数 与 无 符号 数 的 建议 
史 储 我 们 看 到 的 那样 ， 有 符号 数 到 无 符号 数 的 大 式 强制 类 型 转换 导 殖 了 某 些 与 直觉 不 相 特 的 


行为 Шаты а кіл AR GR FEH BUS B iC МЖ 163 083 It 
H iW dau. РЫН RORIS, ПЖ Tunaw. 


ЕКІ Ех | i | 
Ёк К, ИН а ФИТАИ, РАНА ФА рь АЯ, 
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1 / WARNING: This is buggy code */ 
2 float sum elements(fioat af], unsigned length) 


1 int 1: 
5 float result = d; 
Б 


for ti = 0; i <= length-1; i++} 

8 result += alil; 

9 return result; 

10 } 

当 运 行 时 参数 length 等 于 零 ， 这 段 代码 应 该 返回 0.0。 (e X ER E, аі |А memory ) 
错误 ， 请 解释 为 什么 会 发 生 这 样 的 情况 ， 计 且说 明 该 如 何 修改 代 三 ， 

避免 这 类 错误 的 一 种 方法 就 是 绝 不 使 用 光 符 号 数 。 实 了 奈 上 ， 除 了 C 以 外 很 少 有 语言 支持 无 得 
号 整数 。 很 明显 ， 这 些 其 他 语言 的 设计 者 认为 它们 的 麻烦 要 比 瘟 处 多 得 多 。 比 如 ，Jayva 只 支持 有 有 
符号 整数 ， 并 日 要 求 以 二 进 制 补 码 运 算 来 实现 。 正 常 的 右 称 运算 符 >> 被 定义 为 执行 算术 右 称 。 特 
ЖА ВНЕ ИТ. 

当 我 们 想 要 把 学 仅仅 看 做 是 位 的 集合 而 没有 性 何 数字 意义 时 ， 万 符号 数值 是 非常 有 用 的 。 例 
n de -个 字 中 放 入 描述 各 种 布尔 条 件 的 标记 ( flag ) 时 ， 就 是 这 样 。 地 址 自然 是 无 符号 的 ， 所 以 
系统 程序 员 发 现 无 符号 类 型 是 很 有 帮助 的 。 当 实现 模 运 算 和 多 精度 运算 的 数学 包 时 ， 数 字 是 由 子 
的 数组 来 表示 的 ， 无 符号 值 也 会 非常 有 用 。 


23 整数 运算 
许多 刚 入 站 的 程序 员 笑 常 惊奇 地 发 现 ， 两 个 正 数 相 加 会 得 出 一 个 负数 ， 而 及 比 较 表达 式 x<y 


和 比较 表 法 式 *-?<0 会 产生 不 同 的 结果 。 这 些 属 性 是 计算 机 运算 的 有 限 性 造成 的 。 召 解 计算 机 运算 
的 细微 过 处 能 够 帮助 程序 员 编 与 更 品 菲 的 代码 。 


2.3.1 无 符号 加 法 

考虑 两 个 非 负 整数 x 和 y， 满 足 0 < x у< 2"-1。 每 个 数 剖 能 表示 为 w 位 无 符号 数字 。 然 而 ， 
如 果 我 们 计算 它们 的 和 , 我 们 就 有 一 个 可 能 的 范围 0<x+7<2 2。 表示 这 个 和 可 能 带 要 wel 位 ， 
例如 ， 图 2.14 展 水 了 当 x 和 y S Ur. РА X e y 的 坐标 图 : Қ Cop dor EO. RE 
范围 为 0~~15， 介 是 和 的 取 值 范围 为 0~ 和 0。 函 数 的 形状 是 -… 个 有 坡度 的 平面 。 如 果 我 们 保持 和 为 
一 个 w+1 位 的 数字 ， 并 用 把 它 如 上 难 外 :个 数值 ， 我 们 可 能 需要 w+2 个 位 ， 以 此 类 推 。 这 种 持 绿 
的 “ 字 长 膨胀 ”意味 着 ， 要 想 完 整地 表 泵 算术 运算 的 结果 ， 我 们 不 能 对 字 长 做 任何 限制 。 一 些 纲 
Еа, DIN Lisp， 实 际 上 就 支持 无 限 精 度 的 运算 ， 多 许 任意 的 【当然 ， 划 在 机 器 的 存储器 限制 
之 内 ) 乏 数 运算 。 更 常见 的 是 ， 编 程 语言 支持 固定 精度 的 运算 ， 因 此 像 “加 法 ”和 “乘法 ”这 样 
的 运算 不 同 于 它们 在 整数 上 的 相应 运算 。 

无 符号 运算 可 以 被 视 为 一 种 形式 的 模 运 算 。 无 符号 加 法 等 价 于 计算 模 ?的 和 。 可 以 通过 简单 
HE SE x+y 的 w+l 位 志 示 的 高 写 ， 来 计算 这 个 数值 。 比 如 ， 考 虑 一 个 四 位 数字 表 沙 ，x=9 和 y=12 
的 位 表示 分 别 为 {1001] 和 [1100]; 它们 的 和 是 21, 五 位 的 表示 为 [101011。 但 是 如 果 我 们 丢弃 最 高 位 ， 
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Tg, WAER., НЕН S. ЙЕНІ mod ljas 一至， 
ей. 





围 之 14 整数 加 法 
НТ, RS ENE Ti. 





Hil БЕШЕНЕМЕ ЕЕ 
"| pa], Ao] | 时， HHI i Hi. 


Піс, RATES S. in rey 627, Mi wl ЕТТЕН e T 0. BEER 
已 不 全 改变 这 个 数值 ， 另 一 方面 ， 如 果 2 Sx yc27, 和 的 w+l 位 表示 中 的 最 高 位 会 等 于 1， 因 
ЖЕГЕН ST АЖ р k T 2", [Н 2.158 站 这 两 种 情况 。 这 会 得 到 一 个 范围 O44 y- 2^ < 
27" -2* «27 ff. HERF xc 与 y PERI AAR 07 HER LEGE х= rM y MER +, 
lH üesrvecz, WF, 


н X у, х+у<2" 
Х+ y= | 


R= (2.9) 


56 $t 
REEE C 中 执行 两 个 ъ (ЕНЕ ПЫН ИІП. 

W EKENEGE TD. С КИЕ ЛЫН ЕТІНЕН 5. inde 2.9 
Bras Т ИОН SES KI. Ж ЖЕТИШ. Ш216й T YK а xe vinis 
mque. 这 个 和 是 技 模 工 =16 计算 的 。 当 хус H, ZEE Шш. ЖН х у хну. АЙ 
ВРЕТ Л "EW" HAH. хау 161, ШЕЙІН, ЕУ ЕА 16. AMR 
ГЕ іа ug" В. 

当 执行 C 程序 时 ， АННЕ НН ТЕ АЗЕ О ЖАН. ГА Е, ОЕ EELER 
ЕТЮ. 比如, RRMA Lv, HARDEN; EFF жау. 我 们 声称 当 目 仅 当 
sx (ЕНЕ теу) P. ЖЕТИШ. ERROA 5. ШЕЙ ver Bitit s 没有 进出 ， 
RERNE =. J-F. WR ALAT. RIRH 5s=x+y- 下 ,假设 y < 六 我们 就 有 
yer eh Bi; s-ry-2" «x. ИПИЧКЕ, ЗИПЕН93212-5. HA 50, ЖОЙ 
ПЕСИНЕ ТЕЬ. 


К mk EE 





Н216 ХӘ 
ШШШ РЕ}. mde 16 的 ， 

ШШЕ GE Г РАЧЕ ELA, B: DM А: ( Abelian group), BELLIER E. Niel Henrik 
Abel (1802— 1829)? КҮН ТЕН. БИН, CETAN (АЙНАШ “Abelian” КІН) 
к. mdi Tono. ЕР intika, ЕАН З ВЕ РЕА, w 4 
HX Nm. WITEN at. s FT x ERRETA- x WE- re! хай. 3 
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r=, ЛЛ ШМА О, ЯТі>0, BE 2x. ДЕТУТ 0< ес" НЕЦ 
ZH. iHi + 29.) mod 2" 22" mod 2" = 0. ІНЕ, Tc RE x E FORT. ЕНЕ 18 
ІНГШЕт«е a" t, 


X, х= 
rad” (2.10) 
1"-x, r2»0 


ЖЫШ 2.24 L | 


ANEA- Е RARE кч ü eX. ярни} STA, AFA 
210343 FA, EST FO E MPH em (Tribe HA) 





232 二 进 制 朴 码 加 法 

对 二 二 进 制 补 码 加 法 也 有 类 似 的 问题 ， 给 定 在 范围 -2 у 之 内 的 整数 值 x 和 у, © 
HARREN- <х+у<2°-2 28. 可 能 需要 w#1 Жк. BLUE —HM. RIDHIDHER 
Abs (o. Xo fH АЛАРЫН. ЖШ, МЕЖЕ EH REI EE, 

ӨЗЕНІ ніп ЕАР RUSSE RES Н НИЈЕ Жл. ЖГ. BEEN UE 
ИЕНЕН ЖАТТА ЕБ ЖЕГЕНЧЕ. 因此, RETE XE EON а ШЕ, 
(cx NEN Ey ЁЕЖз +! WET onys: 


z+, у & ШТ, (Т0 (z)+" T2U i y)) (2.11) 
VOR 23, RITE ТЭШ хун х, o2" x Ж T2U YS Ж у. ey. 使 用 属性 ， 即 + 
ЕҢ 2° 的 加 法 ， 以 及 十 数 加 法 的 属性 ， 我 们 就 能 得 到 
r+, 二 
U?T, [(1,.,2" x7 y, 12” +y)mod2"] 
= U2T [(x-- y) mod 2" ] 
BET 2 Ry “Ал, DEOS TOD, 
ATENAH RR. LERTE LOUER х+у Ayer mod 2". Шо 


2 = Ш2Т, (2). Wiz ST i+. у. ПЕЛЕНИН. ШІН 217 所 示 ， 
|.-2°&:<-2"", RE. RUBER zo 2". ЖШН Oz e-ur, 26, Ñ 


55 2% 


们 看 到 z EWE er HANZA. iha BB E (negative overflow), TRIS T TRE : 
i у 相 加 【这 是 我 们 能 得 到 < 7" 71550. 88I7 HERI R Z= r+ ye2". 

2.-2" szeb, ЖА. AXE ага”, @Щ|-2='+2*—2”=!< гео". 检查 等 式 26. НІН 
Biz {ҮК Еш as -2 的 范围 过 内， 因此 己 =z -2 -Faz WAR R ARR г" 
ЗР x y. 

305:c2". ЖА. RHAG sn MBlozz-2"7' ЕЕГег-. Ж НЕП, УЙ 
PERRI у + у. 

42" со", RA HUE гат. P|” 六 ,但 是 在 这 站 范围 内 ,我 们 及 =- 
得 到 :s+ y. BARRER А (positive overflow)。 我 们 将 正 数 x Жу 相 加 (也 是 我 们 
iE B 22". i 730. В Е Ц IR y-2". 


„А 


*?" тшн 





217 KAHOY nE 
а у Ф-Н, AEREA. SEREF Н, ЖЕШ. 


ЙЕНЕ. TUS EAN- s x 527-1 >т йу ЕЙ +! 时 ， 
STEEP GATES T: 
rey-2", 2*5 gy T hr 
r+ y ara — -2U &aeyc1"! 正常 (2.12) 
кү", х+у&-2*^' "i i 


作为 说 明 ， МЕНТІ Eni ima npe. S TH i bs ER 
PEA LATAE PAWR. 注意 2-16. КЕЛШЕЙЕІНЕ ЕНЕ kis, foi Н 
ЗН НЕЕ, 16. TRIS T EW ЕИ ЖИЕ ЕНШ Жл: Raju А. (EX isl 
Wn unie akak sy. АНЕ. 

W 2.19 Ж T FE w =4 ЗЕ, 15И ШЛ-В-—7 mE. r+ y. 8 H. 
СЕЕ s Od HH, 导致 和 增加 了 16. 3-8<r+y< 88 MORE хау. reyog, 
ША ТЕН, ӘНШ Т 16. i3» soni] f —# ЖЕТ Brei — TN. 


кеші 


ШІЛ. 59 


FA 2.12 BEERHETU E THESE Fn Ц. Эх йу ЖШ. EE yz0 时 ， X 
ЖЁН ИН. Эх у ЖЕШ. Ee! y<0 时 ， 我 们 会 得 到 正 溢出 ， 
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[1011] 


[0101] 





| Т 
4 10 1 
[0101] 


[0101] 






| | [10101 


218 二 进 制 补 玛 加 法 示例 
uL rcu Ж НЫ п Н ИЕН, ЖИИ 117 11123 









| ЕСІР = 
ЕТЕ АПШ Е. Злеус-ЕҢ, КИФАЯ АШ, fü'"re«yz8H, Фра, 


5 3B 2.25 


BUB 2.18 АЕ ee а КИЕ. ТТ p Sb b aed. 
АР dL c. BARRA 212 推导 的 情况 


60 %2% 


о БЕСТЕ СЕ 
ке ше ү ү 
mm лт | | 
[um ww | | — | _ 
шы шор ү |р 
Cmm 9m | | | 


233 ”二进制 补 码 的 非 

我 们 可 以 看 到 范围 -2” < y < 2" 中 的 每 个 数字 x 都 有 + 下 的 加 法 道 元 : 首先 , 村 于 Xx-2* ， 
我 们 可 以 看 到 它 的 加 法 道 元 就 是 -x。 也 就 是 ， 我 们 有 -2 < x< 2" Ix x-oxexz0. 18—77 
E. WF x= 2" = TMin,，-x = 2 不 能 被 表示 为 一 个 w 位 的 数 。 我 们 声明 ， 这 个 特殊 值 本 身 就 是 
ЕЕ, 下 的 加 法 道 元 。-2” 41-2" 的 信和 由 等 式 2.12 的 第 三 种 情 涪 给 出 ， 因 为 -2” + = 2", 
这 得 到 -2”+w 2” 2 2* + 2*=0。 从 这 个 分 析 中 ， 我 们 可 以 定义 对 于 范围 -2 < x < 2” HIE x 
TERAM 9 (negation operation? ШК; 


-i —1 
| -2 , x=-2" 
_ k = | 

— x, х>—2" 
















(2.13) 


WE 2.26 


A ISTA) — РАНЫ k k KK Ek w=4 的 位 模式 。 对 于 这 些 数字 的 二 进 制 补 码 的 解释 ， 
HETE., METET HAA, 





对 于 .二进制 补 码 和 无 符号 【练习 题 2.24) dE (negation) P Ж e К, do mA 


一 秆 有 名 的 用 来 执行 位 级 一 进 制 补 码 的 非 《negation) 的 技术 是 ， 对 每 个 位 取 反 (或 取 补 )， 然 
тн АЛП T. 在 C 中 ,这 可 以 写成 xX+1。 为 了 验 让 这 种 技术 的 正确 性 ， 可 以 规 骞 ,对 丁 每 个 位 多 ， 
RIE x= 1- x. RIE -个 长 度 为 w 的 位 向 量 ，x= В2Т„(х) Hemd ЖЫМ. ЖЗ 
X 2.2， 取 友 了 的 位 向 量 "K 有 如 下 数值 ， 


5Е МЖ ыҚ 6] 


w- 
B2T,U3) = -2 Y cx Y? 
i=) 


FRI Hio 
- - 201,4. Presa 4 »1 


үз) 1=0 


[-28 142" ! -1]- B2T, (X) 
= -1-x 

二 述 排 导 中 ， 关 键 的 简化 是 > ”2 227-1. ЕСЕЛІ, ИОВА Т. 

ЖЕНЫ ел AI x [хое xol x n 1. ЖАҢ пс E Y Л: БЕЛЕЛДМ o ДЧК Е, 
IX НАШИ Ах», X o. Ха б, 1. Ub IE. А ПЖ ілесу Ў ха X... Xon L 
0,0]; OSEE x PEDES RAIL, Len URR, Жапек EAO, 01. 29 T. HR iner ) 
得 到 的 是 x+,, 上 的 世 级 表示 ， 考 虑 下 面 的 情况 ， 

І. ^3 z[L.],, DE 79 х=. 被 增加 的 值 nero |0. --, ОҢ 480. 

2. 4Ak-w-1 W, 80 р [0, 1, 19, REA х= Tax,。 被 增加 的 但 iner(x) 2[1,0,*,0] 8 AH 
Tin,。 从 等 式 212， 我 们 可 以 看 到 TMar, t 1 是 正 溢出 的 情况 之 -， 得 到 TMin,。 

3. 4k«w-L В, ЮЙ х ТМ, Пхже-1 时， 我 们 可 以 看 出 incer НЕ k+ ЖИН >, 


к] 
fix ME k НАА У 2 22  —1. 它们 的 高 w-k+1 位 有 相同 的 数值 。 内 此 ，incr{( 习 有 数值 
i=Ü 


xl. ШЕ, Ж x> TMax,, УЕН, хт 也 等 于 x+1。 
КАН КЕ, É 220582; Б СЫҚЫР» 和 加 1 ЕШІН us JL VU e E E] RC RS 


[0101] [1010] - [1011] 
[0111] 1000] - (10011 


[1100] - [0011] [0100] 
(00001 [1111] - [0000] 
[1000] - [01 L1] [10001 


Fd 2.20 了 最 反 《或 取 补 ) 和 增加 由 位 数字 的 示例 
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234 无 符号 乘法 
(ELO € x, y € 2-1 内 的 整数 x 和 yn] 以 被 表示 为 w 位 的 无 符号 数字 ， 但 是 它们 的 乘积 x .的 
ИЙ BS 07-2"-1y = 229-0800 之 间 。 这 可 能 需要 2w 位 来 表示 。 不 过 ，C 中 的 无 符号 乘法 被 定 
多 为 产生 2w 位 的 整数 乘积 的 低 w 位 表示 的 值 。 根 据 等 式 ?2.7， 我 们 可 以 看 出 这 等 价 于 计算 模 2" BU 
RE. МЕ, „м at S debis Boc 的 效果 为 
х® у= (x. y) mod 2" (2.14) 
KRAANE Bae RUE py, T 96 Nain ELE Н! НЕ ETE ЕН ЕТ PRO, 727-713, 


62 2} 


u жу u 
+, ов D, 1). 


2.3.5 ”二进制 补 码 乘法 

范围 -2 < x, y < 277-1 N BJ 9630 x Ж у URETA w rt) its aor, Bird Be 
AR x- у ЧИШ ЕШ 29-721. (7271-0 = 2774371271. là 2 之 间 。 要 想 用 二 进 制 补 玛 来 
ЗЕДОА, А BER SE 2w 位 一 一 大 多 数 情 说 下 只 需 格 2w-1 位 , 但 是 特殊 情况 277^ ЕЕ 2w 位 ( 包 
括 一 个 符号 位 0)。 然 而 ，C 中 的 有 符号 乘法 是 通过 将 w 位 的 滋 积 截断 为 mw НЕНІ. RETR 
2.8. wi E EH BEES RI MX. 


x *, у= U2T,((x - y) mod 2") (2.15) 


BTW GRE SN ЫЫ ЖЕЖ, Sdcs REB ӘКЕ TH. gd. Ze 
КЕ у НАНЕ x uy. AAH ЖЕДИ GU 820.0) [f] {у 2 3€ on t — ox dil 4F B se IR 
нат, ун, ВОТ, GO BÉ f RR [e]. XE BH LS aT UL] — BERTA TR ТА RF TERE 
法 ， 


为 了 看 清 这 一 点 ， 设 x = B27 (大和 = 丈 了 (办 是 这 些 位 模式 衷 泵 的 二 进 制 补 码 什 ， 而 
Х-820 (х) y = В2 (和 是 这 些 位 模式 表示 的 无 符号 值 。 根 据 等 式 2.3, Ж x = x+ x, . 2" 
Му = у+у, 2". 计算 这 些 值 的 模 ОЕ TES. 

(х y)moq2" = (къл, 2°). (+2 med 2” 
zx yt (ay + Yy" + ы, 2241 mod 2" 
= (x-y)mod 2" 
因此 ,x .3 和 x .yy 的 低 w 位 是 相同 的 。 
正如 说 昌 的 那样 ， 图 2.21 展示 了 不 同 的 三 仔 数 学 乘法 的 结果 。 对 于 每 对 位 级 过 算数， 我 们 既 执 


TETTE BATANES RA. 注意 ， 无 符 吕 已 截断 乘积 总 是 等 于 x . ymoq8, Нр 
BAREELIS K ДЕЙИН. 


AX 5 5 [101] 3 СІҢ 15 [001111] 7 [111] 
САНЫН -3 [101] 3 [pi] -9 [110111] -l [111] 


4 [100] 7 [111] 28 [031100] 4 [10] 
ЖИНА -4 [100] -| ІНІ) 4 [D00100] -4 [1001 


Aft 3 (0111 3 [011] 9 [001001] | [001] 
二 进 制 补 码 3 [011] 3 [011] 9 [001001 ] l [001] 
6221 жїл =н НЫНА Ы Ж 
fh A SOME ES RERO AER R RST. ЧЕ Е ЕТЕНЕ. 
i SINE 227 
填写 下 表 ， 说 明 不 同 的 三 位 数字 来 法 的 结果 ， 按 照 图 2.21 的 风格 ; 


(2.16) 
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(ow | * | cb 
Ap 1019] 

— PER 2 E [010] 

无 符号 " 

ФАН " 

AJ [111] MIS 

АНЫН [H1] [111] 


BITRE, 位 数字 上 的 无 符号 运算 和 二 HAE RUE TINI ERE t > ем. * Al 
куз „з *„ ЭЛДИ R AKA DECORUS h _. - 进 制 补 的 运 界 形成 了 环 ( (72 КҮЛДЕН 


t t 
+з Жузу, 0, loe 


236 乘 以 2 的 需 

在 大 多 数 机 器 上 ， 束 数 乘法 扣 令 相当 地 慢 ， 需 要 12 或 者 更 多 的 时 钟 周期 ， 然 而 其 他 整数 运 
算 一 一 例如 加 法 、 减 法 、 位 级 运算 和 移 位 一 -只 需 要 1 个 时 钟 周期 。 因 此 ， 编 译 器 使 用 的 一 项 重要 
的 优化 就 是 试 着 用 物 位 和 加 法 运算 的 组 合 来 代替 乘 以 常数 因子 的 乘法 ， 

WB x 为 位 模式 [x pi хл. АРЕН КН ЕН. ЖА. AFEA EO. 我 们 都 认为 х2 的 位 级 
SURE Bx a Ху, Xo,0.…, 0] 给 出 的 ， 这 里 右边 增加 了 个 0。 这 个 属性 可 以 通过 等 式 2.1 推导 出 
来 : 










н” 1 
B2U ак, X, 272 0, 0D. = Удо" 
і-0 


м] 
= P i Ж 
ізі) 


= x 

ЖР kzw, REAREA ТЕУ m SERE SHE BE ә, (ЯЗ Па, хы." Хы 0,7, 0]. Ж 
式 727， 这 个 位 向 量 的 数值 为 x2* mod2" =х+ 2 。 因 此 ， 对 于 无 符号 变量 x, CRER x<<k 等 价 
T x * pwr2k， 这 里 pwr2k 等 于 甜 。 特 别 地 ， 我 们 可 以 用 JU<<k 来 计算 pwr2k。 

HRUE, RITAS, F ған “ЕН ОНЫМЕН x， 以 及 范 
围 0<k<w NIE к, GERE S wen" QR ce no 进 制 补 码 表示 。 因 此 ， 对 
于 有 符号 变量 x, C 表达 式 xeck 等 价 于 PM ме pwr2k 等 于 25, 

ін, ХЕЛЕН Е, ЖЫ2 ТЕЕ. НЕВА 
НД, ЁШ H BJP, ИП ИЖЕ ЕРШЕ ЖБ E +É, 


5] 2.28 


就 像 我 们 将 在 第 3 РБ, Intel 兼容 的 处 理 器 上 的 leal 指令 能 够 执行 acckeb 形式 的 


计算 ， 这 里 上 或 者 等 于 0、1 或 了， 而 b 等 于 0， 或 者 等 于 某 小 程序 值 。 编 译 器 常常 用 这 条 指令 来 执 
行 常数 因子 乘法 ， 例 如 ， 我 们 可 以 用 ac<1+8 来 计算 3*a, 


用 这 条 指令 可 以 计算 a 6059835 45389 


237 除 以 2 ЮЖ 

企 大 名 数 机 器 上 ， 整数 除法 要 比 整数 乘法 更 慢 一 一 需 紫 30 或 者 吕 多 的 时 钟 盾 期 , 除 以 2 КИП 
可 志 几 移 位 运算 来 实 开 ,只 椒 过 我 们 由 的 是 而 移 ， 而 不 是 左 称 。 对 荆 无 符号 和 一 进 制 补 码 数 ， 分 别 
ЕҢ ЭР A R ASI OKA A H ІМ. 

ЕЕ ЛАО. ЯҒх>0Яу>0, £u] EXT fel scd a Lab X 
为 惟一 的 整数 a ， 使 得 gr <а<а rl. ЯШ. [3.14] 23. [7314] 2 -4 803] 2 3. 

ЕСАБ РАР ВИК. xA XU у, хо, т. x] ERIS SEX. 
КИА ЧУ 0 S Ke we x A w ck d SORS a, Xen xd ЕЖ E x A kART usns 


x0] 的 万 符号 数 。 RIA А, 证明 如 下 : 根据 等 式 2.1, 我 们 有 TODI x = Уа 


和 x = кеті 。 因此， 我 们 可 以 把 x 写 为 Y= 26s. 可 以 观察 到 0<x <=} 2 -2* 一 1， 
Kox'«2*, ХЕ л" 0010. 因此, ot] + рН а Led x. 
"ГДАЙ, Хуп [х„ ыы, 0] 逻辑 右 称 大 位 会 得 到 位 向 量 
[0, , 0, x ыы Xal 

LAARA NE. ERE Ж СНЕ ОНЛ КМ ТЕЕ 2. 因此， 对 于 
LTS Еш x. C 表达 式 x>>k 等 价 十 x/pwr2k, ІХ pwr2k 等 价 于 2. 

现在 考 谍 对 一 个 一 进 制 补 码 数 进行 算术 而 移 将 结 果 。 设 x 为 位 模式 [4, оа, Жл Ж 
补 码 整数 ,向 大 的 农 值 范围 为 0< < w. Ux wk D a. x oss n] BO ОНЫНШЫ, ПО хе 
TIE k хл, е, 机] 表示 的 无 符号 数 。 通过 对 无 符号 情 癌 的 类 似 分 析 , BIE ratre f 0 < < 2, 
得 到 x = [xf2]。 此 外 ， 我 们 可 以 观察 到 ， 算 术 布 移 信 向量 [x, ое, Ен, ІЗІМЕН 

| 

它 刚好 就 是 将 [ei, оу”, 而 从 ww 天 位 符号 扩展 到 ww 位 。 因 此 ， 这 个 移 位 了 的 倍 向 量 就 是 Lzyy] 
E) ВЕЈК 7х. 

对 于 x>0， 我 们 的 分 机 表明 这 个 移 倍 的 结果 就 是 所 期 望 的 值 。 不 过 ， 对 于 <0 у> 0, Ж 
除法 的 结果 应 该 是 | wy |， 这里， 对 于 任何 实数 a, [a 1] 被 定义 为 使 得 a -1 < a xa Е 整数 a'。 也 就 
yb. ЖЕТЕЛ АЖ АТАЛЫШЫ КЕШЕ A. Bl, С 表达 式 -512 得 到 -2。 因 此 ， 当 有 舍 入 发 
ЕРІ, E CRRA УАЗ ТЕЕНЫИ 2. ЖШ, -5 的 四 位 表 尿 为 [1011]。 如 此 我 们 将 它 算 
AE 位， 我 们 得 到 [1101]， 这 是 -3 的 二 进 制 补 码 表示 ， 

我 们 可 以 通过 在 移 位 之 前 “ 偏 置 (biasing)” 这 个 值 ， 修 正 这 种 不 合适 的 伟人。 这 种 技术 利用 的 
是 这 样 一 人 属性 ， 对 于 整数 x 和 有 Y>0 的 [у= 10 + у-у. 因此 ， 对 于 x<0， 如 果 我 们 在 
右 称 之 前 ， 先 将 x 加 上 2-1， 那 么 我 们 就 会 得 到 正确 全 入 的 结果 了 ，。 这 个 分 析 表 明 对 省 使 用 算术 市 
移 的 二 进 制 补 公 本 器，C 表达 式 

{х<0 ? ix - (leek) - 1) : x) >> E 


SEDIT x/pwr2k, 这 里 pwr2k 等 于 2。 例如,: 5 除 以 2, Ri l E s B 3 2-1 = 1, @®{ [1100]. 
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ХАВА 1 位 得 到 位 模式 [1110]， 这 是 -2 的 二 进 制 补 码 表 未， 


ЕЛДЕН 2.29 
在 下 面 的 忧 码 中 ， 我 们 省 略 了 常数 M 和 NN 的 定义 ; 


&Geflne M /* Mystery number 1 */ 
Hderine N /* Mystery number 2 */ 
int arithí(int x, int y! 
{ 
int result = 0; 
result = x*M + YiN; /* M and N are mystery numbers. */ 
return result; 
) 
我 们 以 某 个 M UN 的 值 编译 这 段 代码 。 编 译 器 用 我 们 讨论 过 的 方法 优化 乘法 和 除法 ,下面 是 
ЕРМЕН ИМЕН СЕРЕН Ж: 
/* Translation of assembly code for агісі */ 
inz optarithí(int x, int y) 
1 
int t = X; 
X <<= 4; 
X 一 二 ҚК; 
ib (y < Ü) v += 3; 
Моэ>ш 2; /* Arithmetic shift */ 
return x+y; 


) 
M fs N ty48 3) $ v 


练习 题 2.30 
假设 我 们 在 对 有 和 糙 号 慎 使 用 .二进制 补 玛 运算 的 32 位 机 器 上 运行 代码 ,对 于 有 符号 值 使 用 的 是 莫 
RE, MATERS RAGER. 变量 的 声明 和 初始 化 如 下 ， 


int x = foot)»; /* Arbitrary value */ 
int y = bari); /* Arbitrary value */ 


unsigned ux = x; 
unsigned uy = y; 


对 于 下 面 间 个 已 表 达 式 ， АйзЕМмЯТ ADR 0) x йе y ë, ESOS A (等 于 1 )， 或 者 给 出 使 皖 它 
АБ (等 于 0) ff x fe y АЕ: 


А. [x >= D) i] {{272*х)}) < 0) 

B. (x & 7} Iz 7 || {х<<30 < б} 
C. [x * x) >= D 

D. x 0 || -x <= 0 

E. X > б |! -x >= Ü 
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F. Х*у == ux*uy 
б. .X*y - uvy*ux == -Y 


24 15 


лл Ухо ЕЛІН ЖИН. vox BUT A B Em АЕ Ее V0), ЗЕТІН 
РО (VI<<1) ЖТ. ДАЯН ЕЛЕНА ННІ, RBS. 

直到 20 其 纪 80 SER, ЕТПЕН ШЕН Т B G BJ & JSE Н ЖИК НИШ, АЗАНҒЫ 
ATERRAT. 55. MEE ЖА ЭСА НИДЕ. TIC ВИА НЕ ЕТ ІҢ 
比 数 字 精 确 性 更 重要 。 

大 约 在 1985 p. ЕНЕ Ж IEEE 标准 754 的 推出 而 改变 了 ， 这 是 一 个 仔细 制订 的 表示 
浮 点 数 太 其 运算 的 标准 ,这 项 上 作 是 从 1976 年 Intel 发 起 8087 的 设计 开始 的 ,8087 是 一 种 为 8086 
ЕЕ ШЕН ЖЕНА. AiE 7 William Kahan， 加 州 大 学 伯克利 分 校 的 :位 教授 ， 作 
为 帮助 设计 未 米 处 理 器 浮 点 标准 的 顾问 。 他 们 支持 Kahan 加 入 一 个 IEEE 资助 的 制订 工业 标准 的 
委员 会 。 这 个 委员 会 最 终 采 纳 了 一 个 非常 接近 于 Kahan 为 Intel 设计 的 标准 。 日 前 ， 实 际 上 所 有 
的 计算 机 都 云 持 这 个 后 来 被 称 为 IEEE 溯 点 的 标准 。 这 大 大 改善 了 科学 应 用 程序 在 不 同 机 器 | 的 
n] ЖИЕ. 


Sf. IEEE (电气 和 电子 工程 师 协 会 ) 


& ^e T Ims (IEEE—3k8 "I Triple-E" ) 是 一 个 包括 所 有 电子 和 计算 机 技术 的 专业 
省 体 。 它 出 版 刊物 、 举 办 会 议 ， 并 且 建 立 协会 团体 来 定义 标准 ， 内 容 涉及 从 电力 待 输 到 软件 工程 ， 


在 本 下 中 ， 我 们 将 看 到 IEEE 浮 点 格式 中 数学 是 如 何 被 表示 的 。 我 们 还 将 探讨 会 入 《rounding) 
的 问题 ， 当 一 个 数字 不 能 被 准确 地 表 涉 为 这 种 格式 ， 因 此 必须 被 癌 上 调整 域 考 向 下 调整 时 ， 就 会 
出 现 舍 入 ， 然 后， 我 们 将 探讨 加 法 、 乘 法 和 关系 运算 符 的 数学 属性 。 许 多 程序 员 认为 浮 点 最 没 意 
5, MARRA. RIEF. EA ТЕБЕ 烙 式 是 定义 在 一 组 小 而 至 的 原则 上 的 ， 所 以 它 实 
际 上 是 相当 优雅 和 容易 理解 的 。 


241 二 进 制 小 数 

理 蟹 浮 点 数 的 第 一 步 是 考虑 含有 小 数值 的 二 进 制 数 字 。 首 先 ， 让 我 们 来 看 看 更 熟悉 的 |- 进 制 
表 小 法 。 上 上进 制 表 示 法 使 用 这 样 形式 的 表示 ， dad, 4444 ,， 其 中 每 个 十 进 制 数 d, 的 取 
值 范围 在 0~-9 之 回 。 这 个 表达 式 描述 的 数 了 定义 如 下 : 


d = V 10 Xd, 
数字 的 权 被 定 关 为 和 十 进 制 小 数 点 符号 *.” 相 关 ， 这 意味 着 点 太 边 的 数字 的 权 是 10 IER, 
得 到 整数 值 ， 而 襄 右 边 的 数字 的 权 是 10 HAR. (SE. Plin, 1234» 表示 数字 
1x10 «2x10 3x10 4x10 2 1225. , 
100 
ЧЫН, Е-Е bubus bbad br b EGRE. ЖТА xb ШЕ. GEO, 
bj 的 起 值 范围 是 在 0 一 1 之 千 。 这 种 表示 方法 表示 的 数 户 定义 如 下 ; 
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符号 “." 现在 变 为 了 一 进 制 的 点 ， 点 SAMENE 2 HER, ЯЛЫ mm. АШ, 
101.11; 表示 数字 ]x2 +0х2!-1х29+1х2' er! seule eor. 
MAX 2.17 中 可 以 很 容易 地 看 出 ， 向 左 移动 二 进 制 小 数 点 一 位 相当 于 这 个 数 被 2 除 。 例 如 ， 
| 1 1 .7 


1011, 649455, 而 10.111, 表示 数 2+ ortta ЖАШ, P| ал ҒЫ АН 


м РЕ 2。 例如 1011.1. £8 + 0+2+1+3=11> А 


注意 形 如 011-1, 的 数 表示 的 是 刚好 小 于 ! 的 数 。 例 如 ， олш, iR. 我 们 将 用 简单 的 表 
达 半 1.0-e 来 表 小 这 样 的 数值 

候 定 我 们 仅 考虑 有 限 长 度 的 编码 ， 那 么 十 进 制 符号 是 不 能 准确 地 表达 像 LE 这 样 的 数 的 ， 类 
ый, манжадан х HRS 
ñin, RMK OPE АВЕ ВЕЕ т < 的 精度 ， 但 是 我 们 并 不 能 把 它 准确 地 表示 为 一 个 
二 进 制 数 : 





68 82% 


PLEKI 
汗 写 下 表 中 的 缺失 的 信息 ， 





3 M 2.22 

浮 点 运算 的 不 精确 性 能 够 产生 灾难 性 的 后 果 ，1991 年 2 月 25 日 ， 在 海湾 战争 期 间 ， 沙 特 阿 拉 
伯 的 法 摩 地 区 设置 的 美国 营 国 者 导弹 ， 拦 截 伊 拉克 的 飞毛腿 导弹 失败 ， 飞 毛 腿 导弹 击 中 了 美国 的 一 
个 兵营 ， 造 成 28 名 士兵 死亡 。 美 国 总 审计 局 (САО) 对 失败 原因 做 了 详细 的 分 析 [52]， 并 且 确 定 洪 
在 的 原因 在 于 一 个 数字 计算 不 精确 。 在 这 个 绒 习 中 ， 体 将 重 现 总 审计 局 分 析 的 一 部 分 ， 

爱国 者 导弹 系统 中 含有 一 个 内 置 的 时 钟 ， 实 现 为 一 个 计数 器 ， 每 01 秒 就 加 ]。 为 了 以 秒 为 单 


位 来 确定 时 间 ， 程 序 将 用 一 个 24 位 的 近似 于 二 的 二 进 制 小 数值 来 素 以 这 个 计数 器 的 值 . 特别 地 ， = 


y) T ML | K iË NOE А 
0000110011[00111---› 

其 中 ， 方 括号 里 的 部 分 是 无 限 重 复 的 。 КЛА Hik hl HT Xo Tk] В, + h б x 
23 位 来 近似 地 表示 0.1。 我 们 称 这 个 数 为 x， 

A x-0.] МЫ АНА? 

B. х-0.1 的 近似 的 十 进 制 值 是 多 少 ? 

C. 当 系 纹 初 始 局 动 时 ， 时 钟 从 各 开始， 并 且 一 直 保 持 计 教 ， 在 这 个 例子 中 ， 系 统 已 经 运行 了 大 
的 100 个 小 时 。 程 译 计 站 的 时 间 和 实际 的 时 间 之 差 为 多 少 ? 

D. 系统 根据 一 斩 来 束 的 的 导弹 的 速率 和 它 最 后 被 雷达 侦 测 到 的 时 间 ， 来 预测 它 将 在 哪里 出 现 ， 
TOE k EM TEX £5 2000 米 每 秒 ， 对 它 的 预测 偏差 了 多 少 ? 

正常 地 ， 一 个 通过 一 次 读 取 时 钟 得 到 的 绝对 时 间 中 的 轻微 错误 不 会 影响 跟踪 的 计算 。 Ет, C 
应 该 恢 烛 于 两 次 连续 的 读 取 的 之 间 的 相对 时 间 。 问 题 是 帝国 者 导弹 的 软件 已 经 升级 成 使 用 更 精确 的 
函数 来 读 取 时 间 ， 但 是 不 是 所 有 的 通 数 调用 都 用 新 的 代 枉 替换 了 。 结果 就 是 ， 跟 踪 软 件 使 用 了 一 次 
斌 取 的 是 精确 的 时 间 ， 但 其 他 软件 读 取 的 是 不 精确 的 时 闻 [71]. 
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242 (ЕЕЕ 浮 点 表示 

像 前 一 节 中 谈 到 的 位 置 表 示 法 不 能 很 和 黎 地 表示 非常 大 的 数字 。 例 如, 表达 式 5 x 2” 的 表示 是 
H ТОТ 后 面 跟随 100 个 零 的 位 模式 组 成 的 。 НЫН, 我们 希望 通过 给 定 x 和 yy ВИН. ERU MI xx 
2 Ж. 

IEEE ИВЛ Ү = CIYxMx2 BESORGT IC 

е 符号 (sign) s zug TAN Gm 还 是 正 数 (з=0), ПП TO 的 符 与 位 解释 作为 特殊 

情况 处 理 。 

ө 有 效 数 《significand) M 是 一 个 一 进 制 小 数 ， 它 的 范围 在 1 一 2-8 之 间 , WAE 07 1-е 之 间 ，。 

е 指数 【exponent) 上 是 2 的 上 项 (可 能 是 贷 数 )， 它 的 作用 是 对 浮 点 数 有 加权。 

人 上 吕 数 的 位 表示 被 划分 为 三 个 域 ， 以 编码 这 些 值 ; 

. 一 个 单独 的 符号 位 $ ERRE 5。 

4 大 位 和 指数 扬 exp = ei eeo Saba E. 

e niy CX frac = 扩编 码 有 效 数 M. MERABRE КЖ T TR S BRI EGRE e ТЗ. 

在 单 精 度 浮 点 格式 CQ 语言 中 的 oat) Hi, s. exp 和 frac АЛПА 1 АҒ. k=Q (ҮЙІ n223 位 , pz 
'E— 32 们 的 表示。 在 双 精 度 浮 点 格式 4 语言 中 的 double) Ч, s. exp 和 frac EX 2187 1 VF. k=11 
А п=52 (у, РЕ б У ел. 

给 定位 表示 ， 根 据 exp КИН, ЖАКИН АТА A E — Re REO S IRL 

Hifi IF 

1X f CU ARUM L5 exp Obr SC КАЛУ А 0 СН О), 电 不 是 全 为 1{ 掌 精度 数值 为 255， 
双 精 度数 值 为 20470 时 ， 就 都 属于 这 类 情况 。 在 这 种 情况 中 ， 指 数 域 解释 为 表示 偏 置 《biased) Ж 
h tt S. WAER RARE E= eBia, EP e 是 无 符号 数 ， 其 位 表示 为 esee 
而 Bias 是 一 个 等 于 2 ~--(( 单 精度 是 127， 双 精度 是 1023) 的 偏 置 值 。 由 此 产生 了 指数 的 取 值 范围 ， 
对 于 单 精度 是 -126 一 +127， 而 对 于 双 精 度 是 -1922 一 +1023， 

JS frac 般 释 为 描述 小 数值 Xmmosfel, Kis Of vof ER ЭДИЛ 
数 点 在 最 高 有 效 位 的 堪 边 。 有 效 数 定义 为 大 = 1 р 有 了 时， 这 种 方式 也 叫 艇 隐 例 的 以 1 为 开头 的 
(implied leading 1) 表示 ， 因 为 我 们 可 以 把 帮 看 成 一 个 二 进 制 表达 式 为 feof. BER 
我 们 恕 是 能 够 调整 指数 E, EFAA M < М2 之 中 (假设 没有 滋 出 )， 那 么 这 种 表 水 方 
法 是 一 种 免费 获得 “个 额外 精度 位 的 技巧 既然 第 一 位 总 是 等 于 1， 那 么 我 们 就 不 贿 要 显 式 地 来 表 
ЖЕТ. 

FAKHER 

当 指 数 域 为 全 0 时， 所 表示 的 数 就 是 非 规 客 化 形式 的 。 在 这 种 情况 下 ， 指 数值 是 E= l- Bias, 
而 有 效 数 的 从 是 M= f. 也 就 是 小 数 域 的 值 ， 不 包含 隐 仿 的 开头 的 1。 


S 为 什么 对 于 非 规格 化 值 区 这 样 设置 偏 置 值 ? 


ЖАНА 1- Bias 而 不 是 简单 的 -Bias 似乎 是 违反 直觉 的 ， 我 们 将 很 快 看 到 ， 这 种 方式 提供 了 
一 种 从 非 规格 化 值 平 淆 转换 到 规格 化 全 的 方法 。 


非 规格 化 数 和 两 个 日 的 。 首先 ， 它 们 提供 了 一 种 表示 数值 0 的 方法 ， 因 为 使 用 规格 化 数 ， 我 们 
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必须 总 是 使 好 > ]， 因 此 我 们 就 不 能 表 沙 0。 Ж F, 20.0 的 浮 点 表示 的 位 模式 为 全 0: 符号 位 是 0, 
指数 域 全 为 0【 表 明 是 -个 非 规 烙 化 值 )， 而 小 数 域 也 全 为 0， 这 就 得 到 证 =f=0。 令 人 奇怪 的 是 ， 
当 符 号 位 为 1, 但 是 其 他 域 全 为 时， 我 们 得 到 值 -0.0。 根据 IEEE 的 浮 点 格式 ， 什 +0.0 和 -0.0 {ТЖ 
些 方面 被 认为 是 不 同 的， 而 在 其 他 方面 是 相同 昌 。 

非 规 格 化 数 的 另外 一 个 动能 是 用 来 表 涉 那些 非常 接近 于 00 的 数 。 它 们 提供 了 一 种 属性 ， 称 为 
逐渐 洪 出 《gradual underflow)， 其 中 ， 可 能 的 数值 分 布 均匀 地 接近 于 0.0. 

特殊 数值 

最 后 一 类 数值 是 当 指 数 域 全 为 1 的 星 候 出 现 的 。 当 小 数 域 全 为 0 时 ,得 到 的 值 表 小 无 痛 ， 当 5= 
О Де, 或 者 当 $=1 时 是 -ee。 当 我 们 把 两 个 非常 人 的 数 相 蔷 ,或 者 我 们 除 霉 时， 万 穷 能 够 表示 
洲 出 的 结果 。 当 小 数 域 为 非 零 时 ， 纤 果 值 被 称 为 “NaN "”， 就 是 “不 是 - 个 数 (Not a Number)” fJ 
缩写 。 一 些 运 息 的 结果 不 能 是 实数 或 无 穷 ， 就 会 返回 这 样 的 NaN 值 ， 比 如 当 计 算 \-1 或 -时 ,在 
ЖЛЕ УНИН. Ң ЖА ЖЕШИН SR Da, ИПЛЕ HAE. 


243 数值 示例 
图 2.22 展 术 了 组 数值 ， 它 们 可 以 用 假定 的 6 位 格式 来 表 沙 , 有 大 = 3 КИЕУ nz 2 HAR 
Mv. WERE -1=3。 图 中 的 和 部 分 显示 了 所 有 可 表示 的 值 (除了 Мам). АРОН ЫРА 
末端 。 规 格 化 数 具 有 的 最 人 数量 级 是 +14。 非 规格 化 数 聚 集 在 0 МІНІ. «ЕВ ИОН. ЖАПА 
展示 了 介 于 -10 和 +1.0 之 间 的 数值 ， 这 样 这 部 分 就 能 够 看 得 更 加 清楚 了 。 两 个 过 是 特殊 的 非 规 格 必 
数 。 可 以 观察 到 ， 那 些 可 表示 的 数 并 不 是 均匀 分 布 的 一 一 它们 车 越 靠边 原 点 处 越 栏 密 。 
全 部 范围 





[ЖН ЯНА Эп 





EA А ESI 


m 2.22 6{ч# йй Ё 
4-3 О л=2[Ю0{Ж#%1)., ERE. 


图 2.23 IET RER S МТ s Зл, EPA k= 4 的 指数 但 和 站 = 3 的 小 数位 。 偏 置 晤 
k: 2'1-1=7, BEAR T ОТАН, Ж-Е. ЖОЛ, Л O JE EA ra. ix 


种 格式 的 非 规格 化 数 的 B=1-7=-6， 得 到 25 = + ГІ MERTER O, 从 而 得 到 数 Y 


| 7 7 
的 范围 是 0 一 =- ， 
шы 6x64 512 


Шой 位 表示 ë Ë f 
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= |< 


ü 0000 буй 
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Epid ð gé 201 9 -6 - 一 EN 
8 8 512 
0 0000 01 0 ғ 2 2 _2_ 
8 8 512 
3 3 3 
? 0020 011 ( -6 2 2 EN 
4 В 512 
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E33 ИЕ б 0002 000 | -6 0 
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со |= wi wi ajg ac | "= 






景 人 的 规格 化 数 3 1110 111 H ; 


rA ^ 1111 020 — — — __ не 


2.23 8 fr As uH SE P АТИ 
Н k = 4 TUE н = ЗЕН. EI T. 
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这 种 形式 的 最 小 规格 化 数 同 样 有 巨 =1-7 =-6， 并 用 小 数 取 值 范围 也 为 T OA. HNM 


x 7 15. 8 12, 
АНЫҚ 1%0-1-1з---- B), IE VAIESEEB—— 一 一 一 之 间 。 
8 8 512 512 


jj 以 观察 到 县 大 非 规格 化 数 -二 和 最 小 规格 化 数 -二 之 间 的 平滑 转变 ,这 种 平滑 忻 妇 功 于 我 们 


对 非 规格 化 数 E HEX. Mi E EXN 1-Bias， 而 不 是 -Bias， 这 样 我 们 可 以 补偿 非 规格 化 数 的 
有 效 数 没有 隐 会 的 开头 的 1. 
当 我 们 增 太 指数 时 ， 我 们 成 功 地 得 到 更 大 的 规格 化 值 ， 经 过 1.0， 然 后 得 到 最 大 的 规格 化 数 。 


这 个 数 具 有 指数 =7, 得 到 一 个 权 2^ = 128. 小 数 等 二 一 FIERY M -全 ЕЕ, ИЩ V = 240. 


超出 这 个 但 就 会 证 出 到 +ee。 

这 个 表达 式 具 有 一 个 有 趣 局 性 ， 假 如 我 们 将 图 2.23 БІРНЕ АЛНЕАХЕТСЕЙ, € 
人 科研 是 按 升序 排 到 的 , 束 像 它们 表示 的 泽 点 数 一 样 。 这 不 是 惕 然 的 一 一 JEEE 格式 如 此 设计 就 是 为 
了 浮 点 数 能 够 使 用 整数 排序 哨 数 来 进行 排序 。 当 处 理 什 数 时 ， 有 一 个 小 的 准点 ， 因 为 它们 有 开 尖 
的 ]， 并 且 它 和 们 是 按照 降序 出 现 的 ， 亿 是 不 沉 要 浮 点 运算 来 进行 比较 也 能 解雇 这 个 问题 CÉ 
习题 2.56)。 


1&5 2.33 

假设 一 个 基于 IEEE 浮 点 格式 的 5 位 浮 点 表示 ， 有 1 个 符号 位 ，2 ^d (k= 2) 和 两 个 小 数 
位 (n=2) 指数 今 置 量 是 2 -1 = 1. 

下 表 中 列举 了 这 个 5 位 浮上 点 表示 的 全 部 非 负 取 值 范围 .使 用 下 面 的 条 件 ， 填 写 表格 中 的 空白 项 ; 

е 假定 指数 域 是 一 个 无 符号 整数 所 表示 的 慎 。 

E. (E Eve. 

fE 小 数值 ， 

М. SUME. 

Fide A kf 有 和 了 的 值 .被 “一 一 ”标注 的 条 目 不 用 填 。 
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[Н 224 Жл EERE Fg RERDOURE RETE A S BJ ORUSCE TER dE RE] 223 中 展示 的 8 1% 
т, RIERA HA k PORRO по ЕНЕ ЕЛІН 7 RORTE: 


最 小 非 规 格 化 数 es T pigg 43 x 10 2 


RCKEMUR £04 Ua e (1-62 15 12x 10975 (1-ғух z 92 22x10 
最 小 规格 化 数 e e 122712 1.2х 10 38 xr 22х10 
| P ~ 1x 2" 1.0 tx 27 1.0 

最 大 规格 化 数 e ө (2-є}хХ2!'? 34x 108 (2-к)х2' 1.8x 1018 





图 2.24 ДЫЛ R SRU I 

е 值 +0.0 电大 一 个 全 为 6 的 位 表 水 。 

° 最 小 的 正 《positive》 非 规格 化 从 有 一 个 位 表 小 ， 是 由 最 恢 有 效 位 为 1 而 其 他 所 有 位 为 0 构 
BRE. EREDA MAREO 值 = 了 = 2 和 一 个 指数 值 下 = -2 ”+2。 因 此 它 的 数字 值 
Eyar, 

. 最 大 的 非 规格 化 值 的 位 模式 是 由 全 为 的 指数 域 和 全 为 1 的 小 数 域 组 成 的 。 它 有 小 数 {和 
有 效 数 ) 值 本 = 了 = 1-2 六 我 们 写成 1-e) 和 指数 慎 E= -2”+2, 因 此 ,数值 Y 20-27)x27 "^, 
这 仅 比 最 小 的 规模 化 值 小 一 点 ， 

. ЖЕ (positive) 规 丛 化 值 的 位 模式 的 指数 域 的 最 低 有 效 位 为 |， 其 他 位 全 为 0。 它 的 有 
AAHH M= 1， 而 指数 值 瑟 = -2 42. Hit. Avy- 

ТО ЕТЕНЕ БЕЗІ 以 外 ， 其 他 位 都 等 于 0。 它 的 有 效 数值 是 
M=], W) REB E= 0, 

. ЖАШАН ЖЕЛІМ 0, MANERA wi SJ 0， 其 他 位 等 于 1。 它 的 小 
数值 f= 1-2"， 有 效 数 M =2-2* (我 们 写作 2-e)。 指 数值 = 27-1, BURG V = (2-27) 
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x2?" az(1-2" 0x0, 
对 理解 浮 点 表示 很 有 出 的 -个 练习 是 把 样本 整数 值 转换 成 浮 点 形式 。 例 如， 在 图 2.10 中 我 们 看 
4| 12345 其 有 二 进 制 表示 [110000001110011: 通过 向 二 进 制 小 数 点 右边 移动 13 位 ,我 们 创建 这 个 数 
m cms. $89 12345 = L1000000111001, x 22. 4 T A IEEE 单 精度 形式 来 编码 ， 我 们 于 
#JF3K8J 1, 并 用 在 末 居 增加 10 个 0, ЖЕДЕ Л ЩЩ. 得 到 二 进 制 表示 [10000001110010000000000j 。 
为 了 构 道 指数 域 ， 我 们 增加 偏 置 量 127 到 13, 得 到 140, E — EL A X [10001100]. 加 上 符号 位 0, 
我 们 就 得 到 二 进 制 的 浮 点 表示 [01000110010000001110010000000000]。 回 想 一 下 2.14 节 ， 我 们 观察 
到 整数 值 12345 (0x3039) МН ДИН 12245,0 (0х4640Е400) 在 位 级 表示 上 有 下 列 关 系 ; 
C 0 0 3 0 3 9 
ӘРОЦТОФВИЮОПОӘВПІНІЛІПСО0111061 


W Y Ü Ó N wk Kk W жая 


4 Б 4 Ü Е 4 0 Ü 
01000_100100200011109010000000000 


现在 我 们 可 以 者 到 ， 相 关 的 区 域 对 应 于 整数 的 低位， 刚好 在 最 高 的 等 于 1 的 位 之 前 停 直 【这 个 
位 就 是 光合 的 开头 的 位 1)， 和 浮 点 表示 的 小 数 部 分 的 高 位 是 相 匹 本 的 。 
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正如 在 练习 题 2.6 中 提 到 的 ， 整 数 3400593 的 十 六 进 制 表示 为 0x354321, © ЖЖ s 3k 
3490593.0 的 十 六 进 制 表示 为 Tx4AS50C84。 推 导出 这 个 浮 点 表示 ， 并 解释 整数 和 浮 点 数 表 示 的 位 之 
闻 的 关系 。 


Ë SJ 2.35 

A. ЖЖ — МАН n ТЕЗ АБА, Н io K ES eX Ux £ 
起 准确 表示 它 需 要 ?+ 位 小 数 ), 

B. 对 于 单 精度 格式 (28, n-23) io M EU ECT Ў? 


244 ЖА 

EAE GS Bol f EAA AERAR, MOF OE ПЫНАН лоок, BE. xj 
FE x， 我 们 一 般 想 有 OR YR, БЕН “БОЙЫН” ИИО у, ЫШ UE 
AOKGRUDE. ХЕ А. (rounding) 运算 的 任务 。 关 键 问题 是 定义 在 两 个 串 能 值 中 间 的 数值 的 舍 
AAi): 例如 ， 如 果 我 有 1.50 美元 ， 想 把 它 舍 入 到 最 接近 的 美元 数 ， 结 果 应 该 基 选 择 1 美元 还 是 2 
RAWE? 一 种 二 选择 的 方法 是 维持 实际 数字 的 下 界 和 上 界 . 例如, 我们 可 以 确定 可 表示 的 值 z 和 x°, 
使 得 x ЖИНА FENZ Ah x < x< x°, IEEE 浮 点 格式 定 久 了 四 筷 木 国 的 售 入 方式 。 默 认 的 方法 是 
找到 最 接近 的 匹配 ， 而 其 他 三 种 林 用 于 计算 上 界 咎 界 。 

E 225 举例 说 明了 四 种 合 入 方式 ,将 一 个 金额 数 合 入 型 最 接近 的 整数 |。 向 偶数 全 入 
(round-to-even), 123 £29 [n] SE EXIT E LS. (round-to-nearest)， 是 默认 的 方式 。 它 试图 找到 一 个 
最 接近 的 匹配 值 。 因 此 ， 它 将 1.40 美元 使 入 成 ] 美元 ， 而 将 1.60 美元 舍 入 成 2 美元 ， 因 为 它们 是 
最 接近 的 整数 美元 值 。 惟 “的 设计 决策 是 对 位 于 两 个 串 能 结果 中 间 的 数值 的 伟人 。 向 偶数 舍 入 方式 
外 用 的 方法 是 : 它 将 数字 向 上 或 者 向 下 含 入 ， 使 得 结果 的 最 低 有 效 数 字 是 偶数 。 因 此 ， 这 种 方法 将 
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1.5 EWA 2.5 美元 都 省 入 成 2 美元 。 
方式 |6140 | $160 | $150 | $250 | 
[3] IB ЖА $1 52 $2 $2 i-2 













tn] So nir А, 
B F 2 À 
向 上 会 入 





$-1 
4-2 
5-1 








6225 舍 人 方式 说 明 
第 -种 方法 省 入 到 个 最 接近 的 值 ， 而 其 他 二 种 方法 向 上 或 向 于 限定 结果 ， 


其 他 三 种 方式 产生 实际 值 匈 确 界 (guaranteed bound)。 这 些 方法 存 一 些 数字 应 用 中 是 很 有 用 的 。 
ПЗА АЕА РА, А аА, НЕХ, <. Е РЕАЛЕ 
ТЕЛА, ЗЕНА х. ME x sx. ВАЕ ЕА ESA, fS х, 
BE x< Y. 

PPHB Же A 318 FERE ЖАМЫН ВВ НЕ fr ЕНИЕКИІЕЖДЕ? A FA REP 
Pri gam LS AW? RARE ЕН МЕ ИМЕЙ S CAE X PF D f 
Ж. ЛАВА ИА, ИТА ҮТӘ Ан”. Pull DERRRUI АЛЯ 
у 8 УЕА ЕЕ НУРЕ ИА 20, НЫ, Sn REED Ыы Ву nO {ЙТ ЇН 
НТ FS A. ВАА РУНАН ХЕ ЖЫ FAH 6, e REC А Е 
КЕЖЭЭ Т ХЫ ж. d 50ӘЕІМІНЕ, CHALSA, WE ЗОН, Е 
将 向 下 舍 入 。 

其 至 在 我 们 不 报 舍 入 到 整数 时 ， 也 可 以 使 用 和 司 侦 数 尝 入 。 我 们 只 是 简单 地 考虑 最 低 有 奖 数 宇 是 
奇数 还 是 介 数 。 例 如 ， 假 设 我 们 想 将 十 进 制 数 合 入 到 最 粹 近 的 百 分 析 不 管用 那 种 全 入 方式 ， 我 们 
部 将 把 1.2349999 SAB) 1.23， 而 将 1.2350001 $A R 1.24， 因 为 它们 不 是 在 1,23 和 1.24 的 中 间 。 
男 一 方面 我 们 将 把 两 个 数 1.2350000 和 1.2450000 WEA F] 1.24， 因 为 4 是 偶数 ， 

相似 地 ， 同 全数 舍 入 法 能 牙 运 用 在 二 进 制 小 数 土 。 我 们 将 最 艇 有 效 位 的 值 为 0 AARAM. 1 
认为 是 奇数 ,一 般 来 说 , 只 有 对 形 如 ХХНХҮР YO £8 BM BUSES 这 种 合 入 方式 小 有 效 ， 
其 中 XX 和 YY 表示 任意 位 值 ， 最 右边 的 站 是 要 被 会 入 移 位 置 。 只 有 这 种 位 模式 表示 在 两 个 可 能 的 值 
ГПА ИЙ. 例如 ， 考 虑 会 入 值 到 最 近 的 四 分 之 一 的 问题 (也 就 是 ， 二 送 制 小 数 点 的 右 陆 飞 }。 我 们 将 





10.0011. 2 ] 向 下 会 入 到 10.00, (2), 10901104 2— JL АЎ 100122.) 因为 这 些 值 不 是 两 
个 可 能 值 的 中 间 值 。 我 们 将 10111004 294 上 会 入 成 11.003), m 10.101005 F] F À EX 
10.10x 2 )， 因 为 这 些 值 是 两 个 可 能 值 的 中 间 信 ， 并 上 我 们 倾向 于 使 最 低 有 效 位 为 零 。 
245 浮 点 运算 

IEEE 标准 为 诸如 加 尘 和 乘法 这 样 的 算术 运算 的 结果 定义 了 简单 的 规则 。 把 浮 点 值 x 和 y 看 成 实 


数 ， 而 某 个 运算 巴 定 义 在 实数 上 ， 计 算 将 产生 Round (x yy)， 这 是 实际 运算 的 精确 结果 进行 舍 入 后 
网 结 果 。 在 实际 中 ， 溯 点 单元 的 设计 者 使 用 -- 些 聪明 移 小 技巧 来 避免 执行 这 种 精确 的 计算 ， 因 为 计 
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ИНЕНЯ НЕНІ ЕП - Eda АНЕ RATA T. Ы АНКЕ, Щ-0, -ek 
NaN М, IEEE Е Т -EEEE ЯШ, О РЕ оо, dU 040 OE XU 
Р: ою, 

IEEE У А ЫЛЕ МААМЕТ, ЕП РДА or FREIER B0B 1 НЕ CIT 
实现 。 央 此 ， 我 们 可 以 检查 它 的 抽象 数学 属性 ， 而 不 必 考 虚 它 实际 上 是 如 何 实 现 的 。 

arde m TERTE (无 符 导 和 和 二进制 补 码 )， 形 成 了 阿 页 示 群 。 实数 上 的 加 法 也 形成 了 
阿 贝尔 群 ， 但 是 我 们 必须 考虑 售 和 人 对 这 些 属性 的 影响 .我 外 定义 x+ 了 为 Round(x+3)。 这 个 操作 的 
定义 针对 x 利 y ERAR. КЕЗГЕН ИҢЕ БИЛИИН. ДИ x Жу 部 是 实数 。 对 于 所 有 工程 
y 的 值 ， 这 个 运算 是 可 交换 的 ， 也 就 是 说 xz Tiy=y+x。 9, АЕ ТӨРТ. jim, 
使 用 单 精 度 浮 点 ， 表 达 式 (3,14He10)rlel0 求 值 得 对 0.0—— D) & A. (8 3.14 E EX. 58 — IH. 
表达 式 3.14+(le10-je10) 得 出 值 3.14。 作 为 阿 贝 尔 群 , 大 多 数值 在 浮 点 加 法 下 都 有 道 元 ,也 就 是 说 x + -x 
-0. 例外 情 沉 是 尤 穷 “因为 +eo-w = NaN) A NaN, EA FAEH x, ETI NAN +! x = NaN. 

浮 点 加 法 不 具有 结合 性 ， 这 是 殷 少 的 战 重 要 的 群 展 性 。 半 于 科学 程序 员 和 编 详 器 编写 者 来 说 ， 
ХЕНЖЕНЗУ. B. Bx ESSERE LXI ITE 

X = a +Ë + с; 


y =b +< + d; 
НЕ DT E IA ЕНДІ F pA ЖА ET Fie RUE: 


L = Б + Cr 
х= а +L; 
у= +4; 


Am. x ck. KATIE ЕРЕ ТАЈ НАНЕ, HACER T МЕ Sm mm 
AAJA. ЕАР, Е АЯА, TRER, DEHE, Т ЛЕУ AINEI E 
БЕ FRIRE A E, КА s Bu ЯНА НЕА. ЕЕЕ. ПЫ 
非常 保守 ， 避 和 锡 任 体会 革 功 能 产生 影响 的 优化 ， 即 使 是 很 轻微 的 影响 。 

AAHS EAJNA Г TARE AER: ШЖа>ь WAH PIEI ай» ИҢ. 除了 x 
ЖЕР Мам, PE х-а>ха МЫҚ СЫ АШ о 加 法 的 属性 不 被 无 符号 或 一 进 制 补 码 如 法 所 
遵守 ， 

浮 点 乘法 也 亲征 道 常 玩法 所 具有 的 许多 属性 ,也 就 总 坏 的 六 性 .我们 定义 x "у 为 Round (хх y). 
这 个 运算 在 乘法 中 是 持 闭 的 《虽然 可 能 产生 无 穷 大 或 NaN)， 它 是 可 交换 的 ， 而 划 它 的 乘法 单位 元 
A 1.0。 为 方面， 由 于 可 能 发 牛 溢出 ， 或 者 由 于 伟人 而 失去 精度 ， 它 不 具有 可 结 台 性 ， 例 如 ， 单 
精度 辛 点 情况 下 ， 表 这 式 (e20*le20)*Je — 20 求 值 为 ee， 厕 le20*(1e20*le – 20 Ж ЕШ 1е20. 另外 ， 浮 
点 飞 法 在 加 法 上 不 具备 分 配 性 。 秽 如 ， 单 辅 度 浮 点 情况 下 ， 表 法式 120% (120 – 1е20уК{ 0.0, m 
le20*1e20 - le20*1e20 会 得 出 NaN, 

97—218, 对 于 任何 a Рс, ЖҰ Па. ӘЖ e 85522 NaN, WR h Ruka ЕЛІҢНЕН: 

азЬ Пс>0 — a"czb'c 
a>b HB с<0 > а с<ь іс 

此 外 ， 我 们 还 可 以 保证 ， 只 要 az NaN, Ra az. ВАКА, неа Ж 
制 补 吗 的 乘法 没 丰 这 些 音调 性 属性 。 
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246 Сй ай Ул 

C RETARDAR ДЕ ЭЖЕ: float 和 double. (ГЕР IEEE 3$ АЧ Е, ЖЕ 
T as TU OST T ЕНДИК з, Яя, ЖжЖЛД ИЕА ЕМИЕ АЛ д. MES EH 
Jj С ЕЙЕЛ Ж ЖИЛ ИНН IEEE Ен, ЖЫНЫ ЖИА ЛАТЫН Ш-0. +. 
-oa 或 者 NaN 之 类 的 特殊 值 。 大 多 教 系统 提供 include Ch) 文件 和 读 取 这 些 特征 的 过 程 库 ， 但 是 细 
TRE RAS Hm. 例如 ， 当 程序 文件 中 出 现下 列 句 子 时 ，GNU 编译 器 ОСС cg XE INFINITY 
(Жеке) 和 МАМ (ЖЖ NaN); 


# define GM SOURCE 1 
# include «math.h- 


ХІ 2.36 

A F ЖЖ, ERAH A iito, -o4 0, 

#detine 205 INFINITY 

#define NEG INFINITY 

#define ҢЕС ZER2 

fendi t 

不 能 使 用 任何 include 文件 【例如 math,h)， 但 你 能 利用 这 样 一 个 事实 ， 能 够 表示 成 双 精 度 的 最 
大 的 有 限 数 ， 大约 是 ] .8x10， 


HË int. float 和 double 格式 忆 间 进行 强制 类 型 转换 时 ， 程 序 按照 如 下 原则 来 转 所 数值 和 位 模 
A CEU int 32 GN. 
+ Mint 转换 成 float， 数 字 不 会 洲 出 ， 但 是 可 能 被 舍 入 。 
. Á int 或 float 转换 成 double, АА double 有 更 大 的 范围 《也 就 是 串 表 示 值 的 范围 )， 也 有 更 
岛 的 精度 〈 也 就 是 育 效 位 数 )， 所 以 能 够 保 欠 精确 的 数值 ， 
* M double 转换 成 fioat， 因 为 范围 要 小 一 些 ， 所 以 值 可 能 谥 出 成 He 成。 另外 ， 由 于 精确 
БЕУ "АП е А. 
ө M float 或 者 double Жіп, МЕҢ 63 0 287. БП, 1.999 将 被 转换 成 1， 而 -1.999 将 
ERAR I. ЕО УА ЗЕЕ ЛЕН. ЖЖЖ. (БАЛ ЗАН. С БИЕ 
有 对 这 种 情况 指定 国定 的 结 休 ， 但 是 在 大 部 分 机 器 上 ， 结 果 将 是 ТМах, 或 ТМіп,, АЧ w 
是 int 中 的 位 数 . 
*Intel IÀ32 i$ &i5 5E 
在 下 ~… 意 中 ， 我 们 将 深入 研究 Intel IA32 处 理 器 ， 这 种 处 理 器 大 量 地 应 用 于 今天 的 个 人 计算 机 
中 。 廊 里 我 们 重点 罕 出 这 种 机 器 的 一 个 特性 ， 用 CCC 编译 的 时 候 ， 它 能 够 严重 影响 程序 对 浮 点 煞 
运算 的 行为 。 
像 大 凶 数 其 他 处 理 器 一 样 ，LA32 处 理 器 有 特别 的 存储 器 元 素 ， 称 为 寄存 器 ， 当 计算 或 者 使 用 浮 
尽 笋 时 ， 用 来 保存 祥 点 值 。 比 起 保存 在 主 存 中 的 值 ,， 保存 在 寄存 器 中 的 值 读 写 起 来 更 快 。LA32 非 同 
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一 般 的 属性 是 , 浮 占 寄存 器 使 用 … 种 特殊 的 80 位 的 扩 晨 精度 格式 ,这样 就 比 保 存在 存储 器 中 的 依 所 
使 用 的 普通 32 位 单 精度 和 64 位 双 精 度 格式 ， 提 供 了 更 大 的 表示 范围 和 更 高 的 精度 。 和 在 家 庭 作 中 
2.58 中 描述 的 一 样 , 扩展 精度 才 示 类 似 于 有 具有 15 位 指数 (也 就 是 =15) 和 63 和 位 小 数 { 也 就 是 n=63) 
的 IEEE 浮 点 格式 。 所 有 的 单 精度 和 双 精 度数 在 从 存储 器 加 载 到 浮 点 寄存 器 中 寺 ， 部 会 转换 成 这 种 
档 式 。 运 算 总 是 以 扩展 精度 格式 进行 的 。 当 数字 存储 在 存储 器 中 时 ， 它 让 就 从 扩展 精度 转换 成 单 精 
Бн put U ЛЕ ШШ RS. 

对 于 程序 员 而 言 , 这 种 把 所 有 寄存 器 数据 扩展 成 80 У, 3ETE PUS fr bt as 3 Ha R HE k sB МЕЖЕ, 
会 产 千 : 坚 不 太 好 的 铺 果 。 这 意味 着 在 存储 器 中 保存 一 个 值 ， 然 后 取出 它 就 会 由于 售 入 、 下 滋 或 者 
Гіб, ШЕНИЕ. Э СЕК, 这 种 存 入 和 取出 并 不 总 是 可 见 的 , 会 娃 咎 一些 奇特 的 结果 ， 

КЕРДІҢ ТЕМЕН, 











- ooo — coderdatu/fcomp.c 
1 double recipiint derom) 
= 1 
3 return l.0/(double) denom; 
4 } 
5 
б void do nothing(! {} /* Just like the name says */ 
Ў, 
8 vöid бе»і1(1пі denon} 
3 { 
10 doub.e rl, r2; 
11 int tl, t2; 
12 
13 rl = recipidenom); огей m memory */ 
14 ri = recipidenom];  /*Storedinregister */ 
15 tl = rl == ri; /* Compares register to memory */ 
16 do nothingí); /* Forces register save to memory */ 
17 t2 = rl == r2; /* Compares memory to memory */ 
18 printf("tes-l tl: rl YE $c- r2 &f'ir", rl, tl ? r=" ; '!', r2]; 
19 printfií("testl t2: rl ФЕ $c- r2 РАК", rl, t2 ? '=' i '!', r2); 
20 } 
— `- code/data/fcomp.c 


A B rl ЖО re HR HS ИН) 80. ИИ UTREE, m B. ФЕПЯ 
已 者 是 通过 对 表达 式 ri==r2 求 介 计 算出 来 的 ， 所 以 我 们 预计 它们 部 等 填 1。 没 有 明显 的 隐藏 的 副 作 
HÍ— IRA recip 进行 间接 的 倒数 计算 ， 而 县 未 数 до nothing 就 像 它 的 名 字 表 明 的 那样 ， 什 么 都 没 
于 。 然 而 ， 当 带 优化 选 硕 “-O2” 编译 ， 并 用 参数 10 运行 这 个 文件 村， 我 们 得 到 下 列 结果 ; 

testi ti: r` 0.100000 '- r2 n,100000 

testl t2: г. 0.100200 == r2 0.100000 

58 — АА НН РА Л-ТИ RC IR] P. 而 第 二 个 测试 又 说 它们 是 相同 的 ! 这 当然 不 是 我 们 预想 的 ， 
也 不 是 我 们 想 要 的 ,理解 这 个 例子 的 全 部 岗 节 需要 我 们 学 习 GCC 产生 的 机 器 级 代码 (参见 3.14 节 )， 
但 是 代码 中 的 注释 提供 了 为 什么 会 出 现 这 样 结 果 的 线索 。 函 数 recip 计算 的 数值 返回 结果 到 浮 点 寡 
ер. 大 论 何 时 过 程 testl 调用 某 个 前 数 ， 它 必须 将 削 点 寄存 器 中 的 当前 逢 存 储 到 主 程 序 栈 中 ， 这 
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AE PRORA АЛЛЕ НЕШ r. ЖАТА APART, ФНЕНГЕНЕН ff as B ЕЛЕН Xu ИУ 
存储 器 值 。 央 此 , 在 第 二 次 调用 recip《〈 第 14 行 ) УЙ, ЖЕП 被 转换 并 存储 成 双 精 度数 了 。 在 第 
ZARAZE. TE 2 有 图 数 返回 的 扩展 精度 值 。 在 计算 t 时 【〈 第 15 行 )， 双 精度 数 r] 与 扩展 精 
度数 DL 相 比 较 。 因 为 O3 不 能 精确 地 被 任何 一 种 格式 表示 ， 所 雇 浏 斌 的 结 虹 是 很 。 仁 调用 函数 
do nothing СЖ 1617) 之 前 ， r2 AEEEHÉOE ИТКЕ. EE Q h (351747), 比较 的 是 两 
个 双 精 度数 ， 得 到 结 昌 为 真 。 

这 个 示例 证 明了 在 1A32 机 器 上 GCC ВУ “СТЕ Linux ЖІ Microsoft Windows 系统 上 也 有 相 
同 的 结果 )。 由 于 对 程序 员 来 说 不 可 见 的 运算 , 例如 祁 点 寄存 器 的 保存 和 恢复 , ЖЕ {ЕЛЕ T AS. 
我 们 对 Microsoft Visual C++ 编译 器 的 测试 表明 饭 没有 这 种 问题 ， 

谊 注 ， 我 们 为 什么 要 关心 这 些 趟 一致? 

正如 我 们 将 在 第 5 章 中 讨论 多 ， 视 化 妨 译 器 的 基本 奈 章 之 一 症 ， 无 论 售 化 与 否 ， 程 床 应 该 产生 

AARRE., TS E. ОСС ТАЗ КЕЛ КИМДА ў, 


有 一些 方法 来 解决 这 个 问题 ， 不 过 都 不 是 很 理想 。 最 简单 的 方法 就 是 用 命令 行 选项 
“ -float-store” 来 调用 GCC， 告 诉 GCC 每 一 个 浮 点 计算 的 结果 在 使 用 之 前 都 必须 存储 到 存储 器 中 ， 
租 读 回来 。 这 将 人 迫使 每 个 被 计算 出 案 的 秆 都 被 转换 成 较 低 精度 的 形式 。 这 样 做 会 使 程序 变 鼻 点， 
但 是 使 行为 变 得 更 加 可 预知 。 不 幸 的 是 ,我们 已 经 发 现 妈 使 在 给 出 傅 令 行 选 项 的 情况 下 ，GCC ШАЎ 
НЕМА RRA E. Pu, FEBRAN: 


code/dara/fcomp.c 
1 void testz(int denom) 
2 i 
3 double r1; 
4 int tl; 
5 rl = recipidenom!; /* Default: register, Forced store: memory */ 
6 tl = rl == l.0/idouble) denom;: ҒҒ Compares register or memory to register */ 
7 printfí"'test2 ti: rl £f &c- 1.2/10.0*n", ri, ti ? '=' ; '!'); 
8 } 


code/data/fcomp.c 


қ Hat -02 选项 编译 时 ,tl 得 到 值 1 一 一 比较 是 在 两 个 寄存 器 值 之 间 进 行 的 。 当 带 “ .ffloat-store” 
选项 编 详 时 ,tl 得 到 值 0! ҢАРАЙ recip 调用 的 结果 被 写 入 存储 器 ， 并且 读 回 到 一 个 寄存 器 中 ， 然 
(1. 1.0/(double) denom 计算 出 的 值 是 保存 在 寄存 器 中 的 。 总 地 来 说 ， 我 们 发 现 程 序 中 看 起 来 
微小 的 改变 能 够 引起 这 些 测 试 以 不 可 预知 的 方式 成 功 或 者 失败 。 

万 外 一 种 选择 是 ， 我 们 能 够 通过 将 所 有 的 变量 声明 为 long double 类 型 ， 而 让 ОСС 在 所 有 的 计 
算 中 都 使 用 扩展 精度 ， 如 下 面 的 代 和 码 段 所 示 ; 

code/data/fcomp.c 
1 long dcuble кесір lí(int denom) 
2 1 


i return 1.0/(long double) denom: 
4 ) 
5 


б void сезезііпі denom) 

3 1 

8 ong double rl, rž; 

3 nt ti, t2, t3; 

10 

11 rl = recip liídenom);  /*Stored m memory */ 

12 r2 = recip l([denom]);  /*Storedin register 7/ 

13 t] = rl == r2; /* Compares register to memory */ 
14 do notaingí!; /* Forces register save to memory #/ 
15 t2 = rl == r2: і% Compares memory to memory */ 
16 t3 = rl == 1.0/ {long double) denom; /* Compare memory fo register */ 
1? printfi"Lest3 tl: rl ЖІ $c- r2 %Г\п", 

18 {асирлер ri, t1? '=' : i, [double) r2); 

19 printfí("test3 tZ: rl $t %с- rZ $D", 

20 (dcublse) rl, t2 ? 'z' ; "!'', (double! r2); 


2] printfí"test3 t3: rl ЖЕ &c- 1.0/10.0Xn", 
22 (double) rl, t2 ? =, : l'j; 
23 | 


code/data/fcomp.c 


ANSI C 标准 允许 long double ЖЖ EH, НЖАРРХКЕШН ЛЕҢ ЗЫП Аа. МАҢ 07 
十 普通 的 double 类 型 .然而 ,对 于 (A32 机 器 上 的 GCC 来 说 , 它 会 对 存储 器 数据 使 用 扩展 精度 格式 ， 
ЛАНУ A S (Aa СОҚ. ОЛА ПЕР ЛЛ ЕНЕ ДЕНЕНІ) 悄 范 国 和 更 人 的 
ЖЫ, MUR m Se ЛГЕН ҮЕ АЖ Я В 58. DERE. НЕ ДЕ МН Қ ТН. 
GCC 使 用 12 字 节 来 存储 long double 2883, ШІП P 5095 КАНЕ (АЖ 10 FP САФ Т, 
但 是 使 出 12 F ПЕНЕН МЕНЕЕ ЕНЕ. Linux ME Windows HE _L HER S] 7T 887; 330. (6I 
ЖАЛАНЫ ле 2 НА H К ЕЕ SERE ETE]. ЛЕШЕ. ЖАЛА L BS ERU Is ME 
IURI OT Н XE 
БЖ; Ariane 5—— 33 S Rë НЕКЕ 

HRF ERRERA —5 Ж JLUAEHPRRBE RR, 1996 4-6 B 4 B. sF+ Ariane 5 КЎ 
初次 航行 来 说 , 这 样 一 个 错误 产生 了 灾难 性 的 后 果 . 发 射 后 仅仅 ЗГА, K HE Tu W ҰЛТ, 
解体 并 且 爆 炸 了 。 火 蔡 上 载 有 价值 $ 亿 美元 的 通信 卫星 ， 

后 来 的 调查 [49] 显 示 ， 控 制 惯性 导航 系统 的 计算 机 向 控制 引 车 喷嘴 的 计算 机 发 送 了 一 个 无 效 数 
据 。 它 没有 发 送 飞 行 控制 信息 ， 而 是 送出 了 一 个 诊断 位 模式 ， 表 明 在 将 一 个 64 а АЖ 16 
BAA ERR, PETHE. 

35 d [oe 5 СКО k PEE, eF kiy Ariane 4 КЎРА ЧТ 5%, ЖИЙ 
Ariane 4 X At HAIR, lloc T AFA, ЕЖ K ARARA TA 16 6. 


+a, ЖІП Апапе 5 火箭 的 系统 中 简单 地 重新 使 用 了 这 一 部 分 ， 而 没有 检查 它 所 基于 的 假 
ii. 


ЖЫНЫ 2.37 
TX Xd x. 了 和 d 的 类 型 分 别 是 int. float 和 double. 'E 46983 (£X 89, КЇ гә d dom iE 
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+оо. -aAA NaN。 对 于 下 面 每 个 C 表达 式 ， 要 和 证 明 它 总 是 为 真 ( 也 就 是 ， 求 值 为 D. АЖ 
给 出 一 个 使 表达 式 不 为 真 的 值 (也 就 是 ， 求 值 为 0) 


А. x == (1ntlifloat) x 
B. x == (Int) (double) x 
С. Ё == [iloat]idouble) f 
D. == (float) d 
E. Í == -{-Ї) 
EF. 2/3 == 2/3.0 
G. (d >= 06.0) |] (f(d*2) < 0.0) 
Н. ide«r?-a == 1 
2.5 小结 


计算 机 将 信息 编码 为 位 (比特 )， ORE HERE ТТЕ. ВААУ KH K & ЛО. ЖАЙ 
ШРШ. ЖЕНА ІСКЕН ET ДЕНІНЕ УЕ ЛЕН ЛУНА E, 

C Ure WV А ЕУ KS ЕКЕН. НАН ЕЛІНЕН 64 位 字 长 ， 
但 是 月 前 大 多 数 机 器 仍 使 用 32 sk. ЛЕНИЕ Н LEER Hd I3, nS a IEE 
IEEE 9408. (ER ЕНІ, JH RAE S Ki Py ERE. ТАНЫ ФОНТАН | 
正确 运算 的 程序 来 说 ， 是 很 重要 的 ， 

C 语言 的 标 浴 规定 在 万 符号 各 有 符号 整数 之 僻 进 行 强制 类 增 转 换 时 , 基本 的 位 模式 不 应 谈 改 变 。 
ЖИМ Е, PE 个 w 位 的 值 ， 这 种 行为 是 由 消 数 T2U, ЖІ U2T, 来 描述 的 。C W SR 
式 的 强制 类 者 转换 会 得 到 许多 称 序 员 无 法 预计 的 结果 ， 闪 党 导致 程序 错误 。 

由 于 编 友 的 长 度 有 限 ， 计 算 机 运算 与 传统 整数 和 实数 运算 相 比 ， 具 有 非常 不 同 的 属性 。 当 超出 
表示 范围 时 ， 有 限 长 度 能 够 引起 数值 溢出 。 当 浮 点 数 非 常 接近 于 0.0， 从 而 转换 成 入 时 ， 削 点 数 也 
= ШМ. 

ЖА ЕН ЕН s H, C Wi ИЕЛЕ Н ИЕЛЕ ТЕ GR tA- - 些 特殊 的 
ЕЕ. BIL ШЕН. Ақ x ВЕНЕ ТЖ. ІНЕ, PISARA CRIMENES ИИЙ ДЕЕ 
的 属性 。 这 就 允许 编 详 器 做 很 多 的 忧 化 例如， 用 (xc<<3-z ҚАҚ 74x 时 ， 我 们 就 利用 了 结合 
性 、 交 换 性 和 分 配 性 ， 还 利用 了 移 位 和 乘 以 2 НЕСЕ Ж. 

我 们 已 绎 看 天 了 儿 种 使 用 性 级 运算 和 算术 运算 组 癌 的 聪明 方法 。 例 如 ， 我 们 看 到 ， 使 用 二 进 制 
补 码 运算 ， x+1 是 等 价 于 -x 的 。 男 外 一 个 例子 ， 恨 届 我 们 想 要 一 -个 形 如 [0,…,0,1…,11 的 位 模式 ， 
H w — & PO f E жн k 1 组 成 。 这 些 位 模式 对 于 掩 码 运算 是 很 夺 用 的 。 这 种 模式 能 够 通过 С 
1А АЕА) Е 生成 ， 利 用 的 是 这 样 一 个 属性 ， 即 我 信 想 要 的 位 模式 的 数值 为 2-1。 例 如 ， 表 达 式 
(1<<8) -1 将 产生 伺 模 式 OXFF. 

浮 点 表 水 通过 将 数字 编码 为 x x 2 的 形式 来 近似 地 表示 实数 。 最 常见 的 浮 点 表示 方式 是 由 IEEE 
БИЕ 754 定义 的 。 它 提供 了 几 种 不 同 的 精度， 最 常见 的 是 单 精度 〔32 应 ) 和 双 精 度 〈64 位 》。IEEE 
Е АЕ HETE A TERR (Ho NaN. 

АРТ МИЯ НАН. [АЕН ШЕНІНЕН, IE Ai RETO TOR 
的 算术 属性 ， 比 如 结合 性 。 


82 $24 


参考 文献 说 阴 

关于 蕊 的 驹 考 书 [40，32] 讨 论 了 不 同 的 数据 类 型 和 运算 的 属性 。C 标准 对 十 精确 的 宇 长 或 者 数 
字 编 码 没 有 详细 的 定 头 ,这些 细节 是 故意 省 去 的 , КИЕ ИГЫ {ОЕ ХАН ЧЫН Қ SEHR, Ci =. 
己 经 有 儿 本 书 [41，50] 符 了 和 请 言 程序 员 一 些 建 议 ， 警 告 他 们 关于 溢出 ， 隐 含 强制 类 型 转换 到 励 符 
号 数 ， 以 及 其 他 一 些 我 们 已 经 在 这 一 章 中 谈 大 到 的 陷 阮 。 这 些 书 还 提供 了 对 变量 命名 、 编 码 风 格 和 
代码 测试 的 有 部 建议 。 基 于 Java 的 书 【 我 们 推荐 Java 语言 的 创始 人 James Gosling $ 578875: -本 
ІІ) 描述 了 Java LEMEE RANAR H. 

Х=®-с- ЛЖ ЩЫ 5186, 301 ІҢ РЕНАН S. Е РЛ ТЕШИ Ж 
路 的 不 同方 式 。Overton 的 关于 IEEE ЗІНЕ ЕНЕ DÀ. 一 个 数字 应 用 程序 员 的 角度 出 发 的 关于 
格式 和 属性 的 详细 描述 ， 


家 庭 作 业 
@ = 考验 慨 念 的 快速 习题 
ФФ = 再 要 5 一 15 分 钟 来 完成 ， 可 能 包括 线 写 和 运行 释 序 
e = 青 要 儿 个 小 时 来 完成 的 持续 习题 

Ф9%9%- 肖 要 一 个 或 者 隔 人 小 旦 期 来 完成 的 实验 任务 

2.38 Ф 

СЕХА УЫЛ ТААЛ E. Е АЕ show. bytes ARAIRE C x ff show-bytes.c?. 8f 
定 这 些 机 器 使 用 的 字 NUR. 

2.39 Ф 

АЖЫ МН] НК B Жаа ТТ show. bytes 的 代码 。 

2404 

缠 写 积 序 show. short. show. long 和 show, double, 它们 分 别 打 印 类 型 为 short int. long int 和 | double 
的 有 语言 对 象 的 字 节 表 沙 。 请 在 几 种 机 器 上 运行 。 

24199 
А 0, АЧ АРЕ ПТ АТТЫН, ТӨЛЕНЕ 2 b. 

242 Ф Ф 

оз T САД, ER TS, H x 的 最 低 有 效 字 节 和 y hj РАУ. РЕ ЯК 
K=Ox89ABCDEF ЖІ y=0x76543210, Ж Ox765432EF. 

243%% 

ПАН ЈА Я, БНС 的 表达 式 ， 在 下 列 描述 的 条 件 下 产生 1， 而 在 其 他 情况 下 得 
80. ЕТМИШ НЕ ЛЕН КЕНІ. 假设 x 是 整数 。 

,的 任何 位 部 等 于 1. 

B. x 的 任何 位 都 等 于 洛 。 

C. x Ff Boe HH B S I. 
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D. x BER АЗ ID КИМИ ЕР 0. 

244999 

编写 Е int shifts аге arithmetic), EEA ARE e ШИ ЖАЛИЛ aT 
生成 ]， 而 其 他 情况 下 生成 0。 你 的 代码 应 该 可 以 运行 在 任何 字 长 的 机 器 上 ,在 几 种 机 器 上 测试 你 的 
代 始 。 绒 写 计 测试 过 程 unsigned_shifts_are_arithmetice(Y)， 该 过 程 情 定 对 尤 愉 号 整数 使 用 的 称 们 形式。 

2.45 ФФ 

你 有 -个 性 务 ， 要 编写 - -个 过 程 ле ds 320， 当 在 一 个 int Ж 了 2 村 前 机 器 上 运行 时 ， 访 程 
序 产 生 1， 和 而 对 了 于 其 他 情况 则 后 成 和， 下面 是 开始 时 的 符 试 ; 

1 /* The following code does not run properly ой some machines */ 


2 int bad int size is i2() 


ji /* Set most significant bit (msb) of 32-bit machine */ 
9 ini. set msb = 1 << 31; 

6 /* Shift past msb of 32-bit word %/ 

fi in- beyond msb = 1 << 32; 

B 


9 /* set msb is nonzero when word size >= 32 

10 beyond_msb is zero when word size <= 32 */ 
11 return set_msb && !beyond төр; 

12 | 


不 过 ， 当 在 SUN SPARC 这 样 的 32 ҮЛ es БАНН ЈАТ, АЈБ alis 0. КІШМІН 
译 器 信息 给 了 我 们 - -个 问题 的 指示 : 

warning; left shift count >= width of type 

А. ЖП u Bp ПЕНЕН W sy C 的 标准 ? 

В. АМЫ, fife i: mt $755 32 位 的 任何 机 器 上 都 能 正确 地 运行 。 

C. 修改 代码 ， 使 得 它 在 mt 至 少 为 16 位 的 任何 机 器 上 都 能 正 勿 地 运行 。 

246% 

你 刚 阳 开始 为 一 家 公司 工作 ， 他 们 要 实现 ' 组 过 程 来 操作 一 个 数据 结构 ， 要 将 4 个 有 符号 字 节 
封装 成 一 个 32 位 unsigned。 在 字 中 的 字 节 是 从 0 (5 最低 有 效 字 节 》 编号 到 3 (最 高 有 效 字 节 )。 你 被 
分 配 的 任 势 是 ， 为 使 用 二 进 制 补 码 运 算 和 算术 布 移 的 机 器 编写 一 个 具有 如 下 原型 的 汕 数 ， 


/* Declaration of data type wiere 4 bytes are packed 
into an unsigned */ 
typedef unsigned packed t; 


/* Extract byte from word. Return as signed integer */ 
int xbyteipackec b word, int oytenum); 


gem. ЖЕШ НЕНІ, Bj TES EY REX—T 32 位 int. 
你 的 前 任 【《 因 为 水 平 不 够 高 而 被 解雇 了 ) WST БЕА: 


/* Failed attempt at xbyte */ 
int xbyLe(packed t word, int bytenum) 


84 2% 


re urt 
{word >> [Dytenum << 3!) & UXFF: 


А. АБА НЕН ? 
В. A HARRERA, МЕҢ AE R T NRE. 


2.47 $ 

AUS КИШ. ERR 2.20 的 风格 ， 表 明 对 五 位 向 量 记 补 【或 取 反 ) 和 加 1 的 结果 。 请 展示 位 
[ж ЖН. 

z 





2.48 %% 

浅说 明 先 减 1 然后 取 补 等 价 于 先 取 补 然后 再 加 1。 也 就 是 说 , 对 于 任意 有 符号 信 х, C Kiki. x. 
x+1 和 (x-D) 产 生 避 样 的 结果 。 你 的 推导 依 束 于 二 进 制 补 码 加 法 的 什么 数学 属性 ? 

249% $ $ 

Ttc EA HEURE CERE x y 的 完全 2w y kas, 其 中 ,x 和 y 都 是 无 符号 数 ， 并 日 运行 的 机 器 .上 数据 
类 型 unsigned Æ w bz I]. 乘积 的 低 w 位 能 够 用 表达 式 x*y 计算 ， 所以， 我 们 只 需要 ”个 具有 下 列 
АННУ pr fg 

unsigned in- unsigned high prod(unsigned x, unsigned y); 

JE ER CHE EE T S EE xy 的 高 w 位 。 

我 们 使 用 ARÉ F mih HE RC: 

int signed an1gh prodiint x, int v); 

它 计算 在 x 和 y 是 二 进 制 补 码 形式 的 情况 下 ，x .的 高 w 位 。 编 写 代码 调用 这 个 过 程 ， 以 实现 
用 万 符号 数 为 参数 的 捕 数 。 验 证 你 的 解答 的 ,E 确 性 。 

Ёл: 看 看 等 式 2.16 的 推导 中 ， 有 符号 乘积 x.y 和 无 符号 乘积 六 у RUE RR. 

2,50 #4 

假设 我 们 有 个 任务 ， 牛 成 一 段 代码 ， 用 来 将 整数 变量 x 乘 以 不 同 的 常数 因子 闫 。 为 了 提高 效 
ж, ЖИЕ АМЕН». -~ eed. M TRAP КВИН, БЕШТЕ ЕЛЕ С 表达 式 ， 每 个 表达 


АЧ =Й ЗЕЙ. 
А. K=5; 
B. K=9; 


C. K=14: 
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D. K=-56: 


25199 

scr Fi Kh С Ж Ал, {а 表示 符号 a 重复 上 次 。 假设 一 个 w 位 的 数据 类 型 。 你 
HRBET UA SHNS р к УЮ. waria jA k ИА, BEDERAK w 的 参数 。 

A. 10. 

B. 0" “IY, 

2,52 ФФ 

假设 我 们 把 w НЕТКЕН О (最 低 有 效 字 节 ) S 8-1 (m T SO. МИЫН НЕ. 
БЕТЕ САЖ ИЗ, ЖЕКЕ TESE АТЕЙ t ИІН DARTU b MM Г. 


unsigned replace byte (unsigned x, int i, unsicned char b}; 
ВА ETRA. Е ГВА LE: 


replace Буіе()х12245678, 2, ÜxAB) --» O0x125B5578 
replace byte(jxl2345678, Ü, ОхАВ) --> 0х123456АВ 


253 %%% 

ЖУРСЕ. (RON srl 使 用 算术 石 称 (由 值 xsra 给 出 ) ЖАЛА, DRE 
其 他 不 包括 太 移 或 者 队 法 的 运算 。 孙 数 зга HERAB (BE хеп 给 出 ) 来 执行 算术 右 移 ， 紧 跟着 
的 是 其 他 不 包括 古称 或 者 队 法 的 运算 。 你 可 以 做 设 Ж 32 ААУ, Г а к БИДІ 20-31. 

unsigned srlíunsigned x, int К) 

I 


/* Perform shift arithmetically %/ 
unsigned xsra = lint} x >> K; 


/* o. t 
) 
int sraíint x, int k) 
{ 
/* Perform shift logically */ 


int xsrl = (unsigned) x >> k; 
/*" o... */ 

} 

2.54 Ф 


我 们 在 一 个 int 类 型 值 为 32 位 的 机 器 上 运行 程序 。 这 些 值 以 二 进 制 补 码 表 示 ， 而 是 它们 都 是 算 
ЖЖК. unsigned 类 型 的 值 也 是 32 位 的 。 
RIIT ERRE: My 并 且 把 它们 转换 成 其 他 无 符号 数 ， 


/* Create some arbitrarv values */ 
int x = гапдйоті); 

inL у = тапдош!); 

/* Convert to unsigned */ 

unsigned ux = (unsigned! x<; 


80 





unsigned uy < {ursigned, у; 


对 于 下 到 每 个 C ФАК. DOI KI ЕЕН Ел. AAE L NEXU 


Mee me. ТИШ, ЖЕН — FE: S 0 S И. 


À. [x<y) == {-Х>-у) 

B. {{х+у)})<<4) + y-x == l7*y+15*x 
С.`^х+^у == {x+y} 

D. (int! (ux-uy) s= - ív-X] 

E. (ix >> 1) << 1) <= X 


25599 


考虑 这 梓 Л, 


(y = 0011). 


A. W Y= B2U (y), BREW HORRA C ESL K y. АТАН ХӘН, 给 出 — H Y 


#l k БЕТ ДА, 
Еж 请 考虑 将 一 进 制 小 数 点 右 移 大 位 刚 结 果 。 
B. 对 二 上 下列 的 y 值 ， 串 的 数值 是 多 少 ? 


(а) 001 
(h) 1001 
(c) 000111 


2.56 % 


RH КИН Fk ЧИА, AETA E A ТРИЯ АША ЗЫР 296%. у 
s vA Qu BI Afr 32 ЖТ. АМ т Gre НО А ШЫ АЕҚ ЖНЖ NaN, 


0 和 -0 ФА A EAE АЈ. 


int float _ae(float x, Float у} 


l 


) 


unsigned ux = f2uix!; 
unsigned uy < бд. (у); 


/* Get the sign hita %/ 
unsigned Sx = ux >> 31; 
unsigned sy = uy >> 31; 


/* Give an expression using only ux, Цу, Sx, and sy */ 
return /* ,,, */ 


* 
ғ 


257 Ф 


ЙА. ЖЕЛІНДІ n 0 АШ, РР, ЗНН Е. ЯЯЖМ. JA fH 


ШУЛА, n5 БАНУ т. 


它们 的 上 二进制 表示 是 由 形 如 Oy vyyyy- НАЛ МИН, КЕ y 是 - :个 
:位 的 序列 。 例 如 ， 的 一 进 制 表 水 是 001010101.-Q = 00， 而 二 的 二 进 制 表示 是 801100110011 ~ 
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A. Ж 5.0. 
B. НЕЧЕНИ Ву K Sy EAT 
С. 最 小 的 规格 化 数 的 倒数 。 


2,58 Ф 

与 Intel 碌 容 的 处 旦 器 也 支持 “扩展 精度 ” 削 点 形式 ， 这 种 格式 具有 在 80 位 宇 长 ， 被 分 成 1 个 符 
Sg. 15 个 指数 位 =153、! 个 单独 的 整数 位 和 63 个 小 数位 (i630. ЖЕНУ E IEEE 浮 点 表示 中 
Ee E SUL. Istius, SE PEG NET. ij， 对 于 不 标准 慎 它 等 本 0. 填写 下 表 , 给 出 这 种 
格式 中 的 de “有趣 的 ”数字 的 近似 值 。 


i | 
енін | р 
ежен ИИ 
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考虑 一 个 基于 IEEE 浮 点 格式 的 16 ЖТ, URGAÜPTUS.7T3BEMS (O70 RIS 
个 小 数位 (C80. TERRE EE 2 -1= 63, 

对 于 每 个 给 定 的 数 ， 秆 写 下 表 ， 基 中， 每 一 列 具 有 如 下 指示 说 明 ， 

FHex， 摘 述 编码 形式 的 四 个 十 六 进 制 数 字 。 


岂 ， 有 效 数 的 值 。 这 应 该 是 一 个 形 如 x VISAS RO x d E muy 是 2 КЖ. В 


ül: 9. өші, 
64 256 
E: ANERE. 
ү; MERMA. US x  Жух2 “т, КЧ хх Ж г 都 是 整数 ， 


-AWT АТЖЖН-, ЕНЕ s=0, M=— ЖІ. ИИГЕ ЖЕНЕН 0x40 ( 上 


БЕЗІНЕ 63+1=64), 3 0935 ОхСО (二进制 11000000;}， 得 到 一 个 十 六 进 制 的 表示 40С0. 
标记 为 “-” 的 条 日 不 用 上 填写 。 
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2.60 Ф 

我 们 在 一 个 inc МА 32 ҰСЫН КЫЛ КЕТТЕР. float 类 型 的 值 使 用 32 位 IEEE 
格式 ， 而 double 类 型 的 人 怕人 重用 64 17 IEEE 格式 。 

RU EC RPI AH X. у с, HEETE НЕ double: 


/% Creaie some arbitrary values */ 
int x = randomi]; 

int y = randomi); 

int и = randomí!; 

/* Convert to double */ 

double dx - (double) x; 

double dv = (double) у; 

double dz = idouble) z; 


АТЛЕТ С AX. EBERT EEXA1. HR SEA 1]， 质 述 其 中 的 数学 
原理 。 否则， 列举 出 使 蕊 为 心 的 参数 的 例子 。 请 注意 ， 不 能 使 用 A32 机 器 运行 GCC 来 测试 你 的 答 
案 ， 因 为 对 村 float 和 double, Efe HRS SE ВО 位 的 扩展 精度 表示 ， 

А, (double)(float) x == dx 

B.dx + dy == (double) (vex) 

C.dx « dy + dz == dz + dy + dx 

D.dx * dy * dz -- dz * dy * àx 

E.dx / dx == dy / dy 


2.51 + 
你 被 分 配 了 一 个 任务 , 要 编写 СРЖИ T BI EUR. 你 意识 到 完成 这 个 的 最 好 方法 
Же ИЛЕ АН Ж IEEE А л. x ANE, 你 的 程序 将 返回 0.0. 当 x 太 大 时 , 它 会 返回 +eo。 
填写 卜 列 代码 的 空白 部 分 ， 以 计算 出 正确 的 结果 。 候 设 函 数 u2f Б [ШЧ nud БЕШ АЛ НЕШЕ 
HAREEK: 
i oat £pwr2!int x] 
[ 
/* Result exponent and significand %/ 
unsigned exp, sig; 


unsigned u; 


lf (X < ) '* Too small. Return 0.0 */ 
exp - 
sig = 

) else if Ix < ) i* Denormalized result */ 
exp < 0 
Sig = 


} elae ІР (x < ) /* Normalized result. */ 


— a. 
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ехр = 
510 = 

} else 1 /% Too big. Return «oo */ 
exp = 
Sig - 


/* Pack exp and sig into 32 bits */ 
ц = exp << 23 | sig; 

/* Return as float %/ 

return u2fí[íu); 


] 

262 Ф 

大 约 公元 前 2350 年， ПВА Т T сп. 如 果 当 上 时 他 有 一 台 计 算 机 和 标准 
库 <imath.h>， 他 就 能 够 确定 的 单 精度 浮 点 近似 值 的 十 六 进 制 表示 为 0x40490FBEB 。 当 然 ， 邯 有 的 这 


些 都 只 是 近似 值 ， 因 为 x 不 是 有 理 数 ， 
A. 这 个 浮 点 值 表示 的 二 进 制 小 数 是 多 少 ? 
B. E ИНН EAT 提示 ， 参 见 练习 顾 2 55， 
C. 这 随 个 k 的 近似 什 从 哪 一 位 《相对 于 二 进 制 小 数 点 ) 开始 不 同 的 ? 
ЖЕЖ 
练习 题 2 1 答案 
- -日 我 们 开始 查看 礼 器 级 程序 ， 理 解 十 六 进 制 和 二 进 制 格式 的 关系 将 是 很 重要 的 。 量 然 本 书 中 
介绍 了 完成 这 些 转换 的 方法 ， 但 是 做 点 练习 能 够 让 你 更 加 熟练 
和 .将 0X8E7A93 转 换 成 二 进 制 ， 
十 六 进 制 8 Е 1 А 0 3 
一 进 制 1000 ІНІ 0111 1010 1001 9011 


B. ЕЛ І101101111001 1100871 E T- ТАЗЫ, 
ННІ 1011 0111 1001 1100 


TAX B 7 9 С 
C. 将 0xC4E5D 转换 成 二 进 制 ， 
TES C 4 E 5 D 


二 进 制 1100 0100 1110 0101 1101 
D. 将 二 进 制 1101011011011111100110 转 换 成 十 六 进 制 ; 

二 进 制 Il 0101 0111 1110 0110 

十 六 进 制 3 5 7 Б 6 
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练习 题 2.2 答案 
x&v IR SRM T B E 2 КЕЛЕТІН ТОНН т. 


EN on (十 进 制 ) 2^ C4 ABEN 
Dm |е 















练习 题 2.3 答案 
这 个 问题 给 你 一 个 机 会 试 着 对 一 些小 的 数 在 十 六 进 制 和 十 进 制 表示 之 间 进 行 转换 。 对 十 较 大 的 
烙 ， 司 用 计算 器 或 者 转换 程序 会 更 斩 方 重 和 可 上 靠 GE 





xem [л 
ка 
= 






10 = 16+12=172 1010 1150 
10“ 16+7=167 | 10100111 


j: 16+14=62 0011 1110 








11 • 16+12=188 | 10111100 





练习 题 2.4 答案 

当 开 始 调试 机 器 级 程序 时 ， 将 发 现在 许多 情况 中 ， 一 些 简 单 的 十 六 进 制 运算 是 很 有 用 的 。 可 以 
总 是 把 数 转换 成 十 进 制 ， 完 成 运算 ， 再 把 它们 转换 同 来 ， 但 是 能 够 直接 用 | 六 进 制 上 作 更 加 有 效 ， 
Ta [Lag eps e m E a. 

А. 0х502с+ 0х8 = 0х5034. & 加 上 十 六 进 制 ¢ 得 到 4 НУУ 1. 

В. 0x502c-0x30 = 0x4ffc。 在 第 二 个 数位 ，2 减 去 3 КАЖ 1181. XS — RO. И 

我 们 必须 从 第 四 位 借 位 ， 

С. 0х502с+64 = 0х506с. 十 进 制 64 (2°) 等 于 十 六 进 制 0x40. 

D. 0х218а-0х502с = Охае. РУХ а 十进制 10) 减 去 十 六 进 制 数 (十进制 12)， 我 们 从 
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RME 16, 得 到 十 六 进 制 数 6 十进制 数 14). 在 弟 一 个 数位 ， 我 们 霹 在 用 十 六 进 制 c {十 
进 制 12) 8E 2, IPFI Ја (十进制 10)。 


练习 题 2.5 答案 

这 个 问题 测试 你 对 数据 的 字 节 表 示 积 两 种 不 同 字 节 顺序 的 理解 。 
A. М: 78 AGmik: 12 

B. 小 端 法 : 78 56 ХЕ: 12 34 


C. AE: 78 56 34 大 端 法 ; 12 34 56 
H- -下 ，show_bytes 列举 了 一 系列 字 节 ， 从 低位 地 址 的 字 方 开始 ， 然 后 逐 - - 列 出 高 位 地 址 的 


罕 节 。 人 三 一 个 小 疹 尘 矶 器 上 ， 它 将 按照 从 最 低 有 效 字 节 到 最 高 有 效 字 节 的 顺序 列 出 学 节 。 在 一 个 大 
端 法 机 妮 上 ， 它 将 按照 从 艇 高 有 效 子 节 到 最 低 有 效 字 市 的 顺序 列 出 字 季 。 


A 


练习 题 2.6 答案 
这 小 问题 又 是 -个 练习 从 十 六 进 制 到 十 进 制 转换 的 机 会 。 同 时 它 澡 给 你 对 整数 和 浮 点 考 示 的 思 


. 我 们 将 在 本 章 后 留 更 疝 许 纲 地 研究 这 皇 表 未 。 


站 .利用 节 中 不 钢 的 符号 ， 我 们 将 两 个 时 写成: 


0 3 5 i 3 2 1 
(0000000001101010100001100100001 


к= dede + Жу r 9 Y ТЕ Ñ x 


4 А 5 E с C 8 4 
01001010010101010000110010000100 


B. 将 第 二 个 尘 相 对 于 第 -个 字 移 动 2 位， 我 们 发 现 一 个 有 21 个 匹配 位 的 序列 ， 

C. 我 们 发 现 除 了 最 品位 1, 整数 的 所 有 位 都 戏 入 在 泽 点 数 中 。 这 正好 是 书 中 示例 的 情况 。 汶 外， 
浮 鼎 数 有 一 些 非 零 的 高 位 不 与 整数 中 的 高 位 相 匹 配 ，。 

练习 题 2.7 答案 

ЕШТЕН 41 42 43 44 45 46. BR- T, PE PRA strlen 不 计算 终止 的 室 字 符 ， 所 以 show, bytes 


АЗЕ F” 


练习 题 2.8 答案 
这 个 题 日 是 一 个 帮助 你 更 加 熟悉 布尔 运算 的 练习 。 


(011010011 
[01010101] 


`a [10010110] 
Е: [10101010] 
akh [01000001] 


alb (D1111101] 
a^b [00111100] 
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练习 题 2.9 答案 
这 个 可 题 举例 说 明了 布尔 代数 怎样 被 用 来 描述 和 解释 现实 捞 界 的 系统 。 我 们 能 够 看 到 这 个 闫 伍 
КАЧИ А у 3 AiE [ИКТ E ЖЕН. 
A. 颜色 的 取 补 是 通过 对 RR，G fl B 的 值 取 补 得 到 和 的。 由 此 ， 我 们 可 以 看 出 ， 日 色 是 黑色 的 补 ， 
黄色 是 蓝 鱼 的 宰 ， 红 紫色 是 绿色 的 补 ， 蓝 隶 色 是 红色 的 补 ， 
B. 黑色 是 0， 而 白色 基 I. 
C. 我 们 基于 颜色 的 位 向 量 表示 来 进行 布尔 运算 。 据 此 ， 我 们 得 到 以 下 结果 ; 
а СООО 1 ШЕ (100) = ЖЫ (101) 
ТЖ (101) & ЖЕСЕ (01) = 蓝 色 (001) 
绿色 (010? AB (111) = E, (101) 


练习 题 2.10 答案 

这 个 程序 依赖 于 ExCLUsIVE-OR 是 可 交换 的 和 吕 结 合 的 这 一 事实 ， 以 及 对 于 任意 的 a, fa 
“4a=0。 在 第 5 章 中 我 们 将 看 伸 当 两 个 指针 x 和 y 相等 时 (也 就 是 说 ， 册 个 指针 指向 同一 个 位 置 时 )， 
xx BE [ X nud I ESSAIS IE TE 


T3 (a^b)^a-la^a)^hbzb 





练习 题 2.11 答案 

观察 下 列表 达 式 ; 

A. x |'OxFF 

B. x ^OxFF 

C. x & "ÜxFF 

НО FEE DUC EAR ЕН ТЕ ЖК ЕД, k SIN OFF 创建 一 个 氛 码 ， 该 掩 岂 8 
ЭЛЛЕР О, ШКА Лу 1. ПЕ, ЕНІН E ER KOEXBE. MAET., X 
达 式 DXFFFFFF00 只 能 工作 在 32 1x 9188 L. 


练习 题 2.12 答案 

这 个 癌 题 帮助 你 思考 布尔 运算 和 典 者 的 掩 人 码 运算 之 间 的 关系 。 代 码 如 小 : 
/* Bit Set */ 

int bisí(int x, int m) 

| 

int result = x | m; 

return result: 

) 

/* Bit Clear */ 
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int bicí(irkt x, int m) 
{ 

int result = x & “m; 
return result; 


) 

很 容易 看 出 ，bis 基 等 价 于 布尔 OR 一 一 如 果 中 成 者 m 中 的 这 一 位 置 位 了 ， 那么 z 中 的 这 一 位 
MAE Z. 

bic 运算 更 如 微妙 一 些 。 我 们 想 要 设置 了 的 (USO n m HS SET 1, АЖ 
玛 取 补 得 到 m ЖАЗП Ж ШЕ ШУН z 的 一 性 为 0， 如 果 取 补 后 的 撞 码 的 相应 位 等 于 0。 我 们 有 能 
ЖН AND 运算 来 实现 这 一 点 。 

练习 题 2.13 答案 

这 个 问题 宪 出 说 明了 位 级 布尔 运算 和 C 语 言 中 的 逻辑 运算 之 间 的 关系 ， 
表达 式 i 表达 式 


x | v ÜxF' Ox(ü1 














^а 





x | 

练习 题 2.14 答案 

表达 式 是 1 (xA y). 

НЕ, SHA HR у уН ВЕ УЛАН, x ^y ET. Алт. ӘЛІН! 的 动能 
Н EET US TERRE. 

HB НІНЕ ЯНА ЖАА, HA BUENOS IR х= у, НЕЕЕЛАН fusus E MH 
Je 381 Sz [B] ES] 1530498351). 

练习 题 2.15 答案 

这 个 问题 是 一 个 帮助 你 理解 不 同 移 位 运算 的 练习 。 


0x60 [00110011] Ox [11110011] OxF3 
0x55 1010101013 | [10101000] xÜAB [00010101] 015 [00010101] 0x15 





>й 2.16 ЖЖ 
RME. WARE ЛЕ КРО ТИИ ЕНЕ ЕНЕ НІКІ. 
ЖЫ SEDET BD 2.1 中 的 值 。 对 于 二 进 制 补 码 值 ， 十 六 进 制 数字 07 的 最 高 有 效 位 为 0， 得 
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ЧЕН, ПЕТ 8—F 的 最 高 有 效 位 为 1， 得 到 - -个 为 负 的 值 。 


шш | 8м 
十 关 进 制 二 进 制 


БЕКЕН 
TER 
? «i 
C me | Pen 


F ИШ 2%+2%+2! 42! = 15 -t= 




























练习 题 2.17 答案 

对 于 32 和 位 的 机 器 , PER ITRIB S EIER E REGE). ОНАН Й: 8-Е 218], 
AAT X ДЕ — 8. БЕН РГЕ {ЖУЛЫН [КЕЕ ЇН. E f meas 1. Ж 
X. WP DETAIL Г. д, 数 0x80483b? 仅仅 有 ?7 个 数字 , 把 起 始 位 填 入 0, 从 而 得 到 0x080483b7, 
这 是 - ЕЖ. 


9048367: 81 ec 84 01 00 00 sub 50х]1#4, *еѕр А, 188 
8048559: 53 pusi %ерх 

ñO483pe: Bb 55 08 mov ÜOxR(&ebp),€edx B. B 
80483cl: 8b 5d бе mov üÜxeí*ebp),Stebx C. 12 
4jdH3c4: Bb 4а 10 mov üxlÜüií$ebn!,£*tecx D, l6 
50483с7: 8р 85 94 fe ff If mov Oxfflffe39i4[(%ebp),%weax E. -3бБе 
S0dB3cd: 01 cb add €$ecx,t*ebx 

80dB3cr: O3 42 10 add üxlüít*edx),$eax F. 16 
8049342: 89 85 ай fe ff IÍ mov $eax,0xfftffea0!t&ebp) б. 7352 
804834828: 8b 85 10 ff ff ff mov Oxfffffflüi(*ebp],&eax H, -340 
BO483de: 89 42 1с mov Феах, 0хІс(Фейх) I. 28 
Ә0483г1: 89 Ча To ft ft zt mov *ebx,QxEtffItficisebpb) 2. -132 
380483e7: 8b 42 18 mov 0х19 {%едхі, еах К. 24 
练习 题 2.18 答案 


以 数 学 的 视角 来 看 ， 消 数 T2U 和 U2T 是 非常 奇特 的 。 理 和 解 它 们 的 行为 非常 重要 。 
解 答 这 个 问题 ， 我 们 是 根据 二 进 制 补 码 的 值 ， 重 新 排列 练习 题 2.16 的 解答 中 的 行 ， 然 后 列 出 大 
从 号 值 作为 消 数 应 用 的 结 时。 我们 展示 出 十 六 进 制 值 ， 以 使 这 个 进程 更 加 具体 ， 
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练习 题 2.19 答案 

这 个 练习 题 测试 你 对 等 式 2.4 的 理解 。 

对 二 开始 的 网 个 条 日 ,x 的 值 是 负 的 ， 并 县 Т0) 2 x 2. АТЫ KAS KH, x BUH E 3E 
В), JEE TZU) = x. 

练习 题 2.20 答案 

这 个 澡 题 抓 强 你 对 二 进 制 补 妈 和 劾 符号 表示 之 间 关 系 的 理解 ， 以 及 村 С 语言 升级 规则 
(promotion тше} 的 影响 的 理解 。 回想 一 下 ，TMiny 2147483648, JE НТ m d AO Ч 
号 数 后 ， 安 成 了 2147483648。 男 让， 如 果 有 任 一 -个 运算 数 是 无 符号 的 ， 孝 么 在 比较 之 时， 男 一 -个 远 
算数 会 被 强制 类 型 转换 为 无 符号 数 。 







-2147183648 == 2147483648U XS Im 
| (meigned, 2.048040 < оызаззызз | ят | 1 
(unsignedi -2147483Ь4В < 21474836487 无 符号 数 КЕ 





练习 题 2.21 ЕЖ 

15 е rp a AA RUE А НОЕ JAAR” 用 来 从 多 个 位 域 打包 成 的 一 个 字 中 提取 值 。 
它们 利用 相同 移 位 运算 的 零 填 充 和 符号 扩展 属性 。 请 注意 强制 类 型 转换 和 移 位 送 算 的 嗪 序 。 在 fund 
中 ， 移 位 是 在 无 符号 word LETA. НДІРУ. Œ fun2 中 ， 移 位 是 在 把 word 强制 类 型 转换 
为 int 之 后 进行 的 ， 因 此 是 算术 称 和 位 。 





B. Яғ AS SHE 8 位 中 提取 -个 值 ， 得 到 范围 0 一 255 之 间 的 一 个 整数 。 霄 数 tun2 
也 从 这 个 参数 的 低 8 位 中 提取 -个 值 , 但 是 它 还 要 执行 符号 扩展 。 结 果 将 是 介 于 -128 一 127 28 
的 一 个 数 。 


ШОН 2.22 答案 


对 于 无 行 号 灼 ， 鹤 上 断 的 影响 是 相当 直观 的 ， 但 是 对 于 一 进 制 补 码 数 就 不 是 这 样 的 了 。 这 个 练习 
让 你 使 用 非 靖 小 的 字 长 来 研究 它 的 属性 。 


正如 等 式 2.7 所 描述 的 ， 这 种 截断 无 符号 数值 的 结果 就 是 发 现 它们 的 模 8 余数 。 截 断 有 符号 孝 
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Hye EE Е E, ЛЕ 28. EH BOAT sS 8 后 的 余数 ， 对 于 参数 0-7, x8 
得 出 值 0~7, 对 于 参数 -8 一 -1 也 是 一 样 。 然 后 我 们 对 这 些 余 数 应 用 国 数 02T ,得 出 两 个 0 一 3 和 -4 一 
1 序列 的 反复 。 





练习 题 2.23 答案 

这 个 问题 着 设计 来 说 明 从 有 符号 数 刘 无 符号 数 的 隐 式 强制 类 型 转换 是 多 么 容易 引起 错误 的 啊 。 
将 参数 length 作为 -个 无 符号 数 来 传递 看 上 去 是 忻 相 当 白 然 的 事情 ， 因 为 没有 人 会 想到 使 用 一 个 值 
为 负数 的 length. BREAK PE i <= length-1l 看 上 去 也 很 自然 。 但 是 把 这 两 点 组 合 到 - -起 ， 将 产后 意 想 
^ fiip) zb 5 t 

内 为 参数 lengh XE ALES S. ИҢ 0-1 ЖЕНА ЕН ЖЕНТ. STARIA. SORE 
UMax,; CE 3214 ДЕ). СЕНА Л ЕСЕ, ПШ ЕЕС) 32 ri TUR 
等 于 UMan 的 ， 所 以 这 个 比较 运算 将 一 直 持 续 下 去 ! 因此 ， 代 码 将 试图 访问 数组 a 的 无 效 元 素 。 

有 两 种 方法 可 以 改正 这 段 代 码 ， 其 一 是 将 length 声明 为 int 类 型 ， 其 二 是 将 tor 循环 的 测试 条 件 
(Ж Уу i< length. 

练习 题 2.24 答案 

这 道 习 题 是 对 算术 模 16 的 简单 示范 ,最 容易 的 解决 方法 是 将 十 六 进 制 模式 转换 成 它 的 万 符 屿 十 
Е. ATEENA, RIERA O x = 16。 然 后 ， 我 们 起 可 以 将 取 衬 了 的 值 转换 凸 十 六 
Ж. 


БЕКЕ БЕКЕ 
[3 [3 
ор 


2 
: 


练习 题 2.25 答案 
这 道 林 题 是 一 个 确保 你 埋 解 了 二 进 制 补 码 如 法 的 练习 ， 





信息 的 表示 和 处 理 27 
i 
-16 
пох [10000] 













-R 
| 11000] [00111] ІШ = 
-2 5 3 
3 3 
8 8 
[01000] [01000] 





练习 题 2.26 ЖЖ 

iX ^ |Ë] Е H] aE; DEZE ЖЕН К di e ВЕРЧ НОЗЕ (negation). 

对 于 w=4， 我 们 有 ТМіп,--8. A-8 EE ACHMEA m. ПЕНЕН EF ЖДУ 
非 的 。 


| NUM 
mM 





对 于 无 符号 数 非 ， 位 的 模式 是 相同 的 。 
练习 题 2.27 答案 
这 道 习题 是 一 个 确保 你 理解 了 二 进 制 补 码 滋 法 的 练习 。 


His 
n б [110] 2 [010] [001100] [100] 
AnGR [001] 7 [11] [000111] [11] 
АЙ SS [H11] 7 [111] [110001] 1 [001] 
ЖМ [111] ІЫ [000001] | 1001] 


练习 题 2.28 答案 
在 第 3 章 中 ， 我 们 将 看 到 很 多 实际 的 leal 指令 的 例子 。 这 个 指令 被 提供 用 来 支持 指针 运算 ， 但 
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E С 编 详 器 经 常用 它 来 作为 执行 小 常数 乘法 的 “种 方法 。 
对 于 上 的 每 一 个 值 ， 我 们 可 以 计算 出 2 的 倍数 , 2^ C 5 90) 和 2*+ 1 ("b Na), ЕЗІН 
НЕЙ ГИН 1,2,3,4,5,8 和 9. 
练习 题 2.29 答案 
我 们 发 现 兰 人 们 直 搂 用 江 编 代码 人 敌 这 个 练习 时 是 有 困难 的 。 但 当 把 它 放 入 到 optarith 所 示 的 形 
式 中 ， 问 题 就 变 得 更 加 清晰 明 卫 了。 
我 们 可以 在 到 M E 15; х*М EEN (х<<4у-х ЖИ. 
找 们 日 以 看 到 NN 是 4; Чу En Е, Еа ERAS). 
练习 题 2.30 59 
过 小 “C 的 迷 题 ”清楚 她 告诉 程 认 员 必 须 理 解 计算 机 运算 的 属性 。 
A, (x >= 0) II ((2*х) < 0), 
(Б. x 3RT--2147483648 《TMinw}。 那 么 ， 我 们 将 得 到 2*x 3340. 
B. (x & 7) != 7 ll (x««30 < 0). 
Я. UA & 7) != 7 XT SX 0, 那么 我 们 必须 有 位 38 T1. ЧЕ 30 fr ND, 3X 
修 世 将 变 成 符号 位 ， 
(C. (x * y) >= 0. 
(x. 73x29 65535 (OxFFFF) Е, x*x 为 -13107] (COxFFFE0001)., 
D. x e 0l -re <= 0. 
KR. ШЖ х ЧЕ. W- 是 非 正 的 。 
E. x >> 0 || -x >= 0 
f. 9х у 2147483648 (TMinD. 那么 x 和 -x у, 
F. x*y == ux*uy; 
算 。 二 进 制 补 馈 和 无 符号 乘法 有 相同 的 位 级 行为 。 
(т. х*у+пцу*шу == -y. 
Ң.. 7х To. utu eraty. (МИ, ТРОЯН | -х*у-у+д*у, 
练习 题 2.31 答案 
HE СЕМИ ERIT see 这 个 练习 让 和 你 试验 一 些 简单 的 例子 
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(5%) 


二 进 制 表示 十 进 制 表示 





ЕШ ИУ 个 简单 方法 是 将 一 个 数 表 示 为 形 如 B ME. 我 们 能 够 将 这 个 形式 
表示 为 -… 进 制 ， 过 程 是 ， 使 用 x 的 一 进 制 表示 ， 并 把 二 进 制 小 数 点 揪 入 从 右边 算 起 的 第 个 位 置 ， 
举 -个 例子 ， ЕТЕ, 我 们 有 By = 1011. ERINE RRE oU al t9 8 ДИ. 
得 到 1.0111,. 

练习 是 2.32 答案 

在 大 多 数 情况 中 ， 浮 点 数 的 有 限 精度 不 是 主要 的 问题 ， 因 为 计算 的 相对 错误 仍然 是 相当 低 的 ， 


然而 仕 这 个 例子 书 ， 系 统 对 于 绝对 误差 是 很 敏感 的 。 
А. 我 们 串 以 看 到 * -0,1 的 二 进 制 表 示 为 ; 


0. 000000000000с00000000001100[1100[ = ; 


MINATI E MIX ab HC. 我 们 可 以 看 到 这 就 是 2 у, 也 就 是 大 约 9.54 x 
10 5. 

B. 9,54 x 105 x 100 x 60x 60 x 10 = 0.343, 

C. 0.343 x 2000 = 687. 

518233 答案 


研究 非常 小 的 字 长 的 浮 点 表示 能 够 帮助 港 清 下 EE 浮 点 是 怎样 工作 的 。 要 特别 注意 非 规 格 化 数 和 
规格 化 数 之 间 的 转换 ， 





100 %2% 


c 
LI 
©з 
H 
ч 
гыз 
i 
Ac 
+ | = 
= ] 


练习 题 2.34 答案 
十 六 进 制 04354321 5X ft T — XE Su f1101010100001100100001].. #2 05 EE 21 іі 
1.101010100001 100100001; x 27. S pcr eth ЖИ 2 个 0 形成 小 数 域 ， 从 而 得 刘 
[10101010000110010000100]. 指数 是 通过 21 LR eL ER 127 形成 的 , 得 到 148 二进制 [10010100])， 
我 们 把 它 利 从 号 域 0 联合 起 来 ， 得 到 二 进 制 表 示 
[01001010010101010000110010000100] 
我 们 看 到 这 两 个 表达 式 的 相关 性 是 ， 整 数 的 低位 到 最 高 有 效 位 等 于 1， 匹 配 小 数 的 高 21 位; 
0 0 3 5 4 3 2 1 
П0000000001101010100001100100001 


Жо КЫ ИК Кі kk УЕ ff k k Жор} 


4 А D 2 0 C B 4 
11йЙ0101001010101000011001000@0100 


5 3)88 2.35 ЖЕЖ 
АЛАНИ RET Л S E ЛЕШЕ АЛЫН NT. 
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x^ PS HHT: BERE л O, Жан, ӨЗІҢЕ 27 +1. 

ш п= 23 Н, (2741216777217. 

练习 题 2.36 答案 

一 盘 来 滴 ， 使 用 库 宏 (iibrary macro) 会 比 写 你 自己 购 代码 更 好 -- 些 。 然 而 ， 这 段 代 友和 似乎 可 以 
上 作 在 多 种 机 器 上 。 

ЖП ЕЕ 1e400 溢出 为 无 穷 ， 


code/data/teee.c 
1 $&define POS -NFINITY 1е400 
2 %деіпге NEG INFINITY (-FOS5 ІМЕІМІТУ) 
3 define NEG ZERO (-1.0;POS INFINITY! 
code/data/ieee,c 


练习 题 2.37 答案 
这 样 一 个 练习 可 以 帮助 你 提高 从 程序 员 的 角度 来 研究 浮 点 运算 的 能 力 ， 
确信 自己 理解 下 向 每 -个 等 案 。 


А,х == íint)(£f£loat) x 
T. А x TMa 时 。 
B.x == (int) (double) x 


X], БАр double 类 型 比 int 类 型 上 共有 更 大 的 精度 和 范围 。 
C. f == (float) (double) £ 


М, ҚА double 类 型 比 float 类 型 具有 更 大 的 精度 和 范围 。 


D.d == (float) d 
їн, Жш. “ла Aj 140 时 ， 我 们 在 右边 得 到 +ee。 
Е.Е == -{-Ё) 


对 ， 因 为 浮 扩 数 取 非 就 是 简单 地 对 它 的 符号 位 取 反 。 
F 2/3 == 2/3.0 


错 ， 左 边 的 值 将 是 整数 值 0， шала OR E IER 


G. (d >= 0.0) I1 ((d*2) < 2.01 
Xp. БЕЙЛЕ Pa W B. 
H. 12-і)-4 == f 
їн, BiU d Eee E 1 ы, ХО NaN, MAARE 1. 
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综合 : 理解 指针 

现实 生活 : 使 用 GDB 调试 器 
存储 器 的 越界 引用 和 缓冲 区 溢出 
* 浮 点 代码 

"E C 程序 中 嵌入 汇编 代码 
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ЕНЕ ЕНІ Си ЕН, Ж) ТЕЛЕ КІН Ж ЗЕН. ЯНУ F. TER Sm 
BHITE ТЕЛЕН e ТЛ ШЫҢ PF ЕЛЕНЕ (memory》 和 用 来 执行 计算 的 低级 指令 。 
大 多 数 时 剧 ， 厚 高 缴 语 言 提 供 的 较 高 抽象 级 别 上 鞋 作 会 更 有 成 就 和 可 靠 。 编 详 黑 提供 的 类 型 检查 能 
HARRIE EER FERARI ERE ASAKA АЕ ЕАО. ERRE 
ш. ЕКЫ ЕЕ РЕ — HEBEL IS Sra Р. УННУ REN ` 
HME HEARE n4 BEES LA R £ AS [н] EAI MERRE E Б ЫЛЕ 
HHRH. 

Лара Т ЯНА ИИН E. HEN Tr ENER A Ж. RASARE ҚЫНА - WAN 
ЖО ЧИНЕ. maita e Е АНОД, на РЕ САИ ЗЕ. AE 2 
过 于 计算 机 执行 的 实际 机 器 代码 。 与 日 标 代 码 的 二 进 制 属 式 相 比 ， 它 前 主要 特色 在 十 它 采用 的 是 更 
加 易 读 的 交 本 格式 。 通 过 阅读 这 些 汇 编 代 凤 ， 我 们 能 够 理 御 编译 器 的 优化 能 力 ， 并 分 析出 代 侣 中 潜 
在 的 低 效 这 。 就 像 我 们 将 在 第 5 章 中 看 到 的 那样 ， 一 个 试图 优化 -- 段 关键 代码 性 能 的 程序 员 ， 通 常 
ЛАЙ МЫНЕ ЕН N, ЖОК ИЛЫМЕ ЕЩЕ АЕ, АШ ГЕНЕ ЖЕТТИ Ж ДЕШ 
WW. У, BANIR, НЕМЕН ЕСЕДЕН А) — Ва, NEEDS 
ют. ЯШ, 313 章 中 会 讲 到 ， 妆 出 线程 也 写 并 发 程序 对， 知道 用 何 种 存储 《storage)j 来 保存 各 
种 程序 变 区 是 很 午 要 的 ， 而 这 些 信息 在 汇编 代码 级 是 可 风物。 程序 员 学 习 汇 编 民 公 的 需求 组 着 时 间 
ЛЕН ЫЛЕ T Te, ҚЕМЕЕЖЕРКТЕНЖНІГ Ев РЕ, MEIE SDK b BEER 
ЕН ЯНЕ PE HOO. 

FAHR, ВИНЕ ЖЛ ЕТТЕРІ , ІНІ C FPF E üa f КЕЛЕА Л S BL as N 
ЕК. ГВЕН ЕНГ АН, ГААТ ГАБ С ОВЕ ЛУК, ЖЕЕ ДИЙ -- 些 技 
KE. RILES / Ж ИЛ КАТЕ SS TEC 程序 结构 变换 成 机 器 代 始 时 所 做 的 转换 。 相 对 于 CC 代码 中 表 
下 的 计算 操作 ， 优 化 编译 器 能 够 重新 排列 执行 顺序 ， 消 除 林 必要 的 计算 并 替换 慢 速 操作 ， 例 如 几 轴 
法 和 移 位 米 代 蔡 于 法 ， 甚 至 于 将 递归 计算 变换 成 迁 代 计算 。 理 解 源 代码 与 对 应 的 汇编 三 的 关系 通常 
不 入 容易 一 一 就 像 监 拼 出 一 幅 跟 盒 了 上 的 图 片 设计 有 点 不 太一 样 的 拼图 。 这 是 一 种 这 向 工程 (Teverse 
engineering) 一 一 通辽 研究 系统 和 闻 丫 -上 fp, ЖАЯ “ 解 系 统 被 创建 的 过 程 。 在 这 个 情况 中 ， 系 统 
E- -个 机 器 产生 的 六 编 语音 程序 ， 市 不 是 由 人 设计 的 某 个 东西 。 这 简化 了 逆向 DEBES. BL pr 
生 的 慌 码 遵循 相当 规则 的 模式 ， 且 我 们 可 以 做 试验 ， 引 编译 器 产生 许多 不 同 程 序 的 代码 。 在 我 们 的 
长 述 中 ， 给 出 了 许多 示例 和 练习 ， 来 说 明 汇 编 语 言 和 编译 器 的 各 个 方面 。 精 通 组 节 是 理解 更 深 和 更 
基本 概念 的 先决 条 什 ， 花 点 时 间 研 究 这 些 示 例 并 完成 练习 是 非常 值得 的 ， 

К, 我 们 简要 回顾 Intel 的 体系 结构 。Intel 处 理 器 从 1978 年 那个 相当 简单 的 16 位 处 理 器 发 展 
前 来 ， 现 在 已 经 成 为 了 课 面 计算 机 的 干流 机 器 。 随 着 新 特性 的 加 入 ， 体 系 结构 也 在 要 应 地 成 长 ， 从 
lo rk АА ДЕН ТЕҚ 32 位 数据 和 地 址 的 结构 。32 МЕНМЕН, ЕНЕ 
ЖЗНЕ ЖАЛЕ. CX SE eb ma HERI TA, BEMAR Е A BUE ЖАЗА ЯСЫ 
SES IS P ja] E Tell АННАН ОСС 和 Linux 使 用 的 特性 的 子 集 ， 这 样 可 以 避免 许多 复杂 性 
U A IA32 的 隐秘 特性 。 

我 们 的 技术 讲解 是 从 快速 浏览 C、 汇 编 代码 以 及 目标 代码 之 间 的 关系 开始 的 。 然后 会 讲 到 TA32 
的 细 方 ， 从 数据 指 表 示 和 处 理 ， 及 控制 的 实现 开始 。 我 们 会 看 到 如 何 实现 C 语言 中 的 控制 结构 ， 如 
If. while 和 switch 语 铝 。 这 时 ， 我 们 会 讲 到 过 程 的 实现 ， 包 括 运行 栈 是 如 何 支持 过 程 间 数据 和 控制 
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的 传递 ， 以 及 局 部 变量 的 存储 (storage), ЖЖ, 我们 会 考虑 在 机 器 级 如 何 洋 现 像 数 组 、 结 构 和 联合 
(union) 这样 的 数据 绩 构 。 有 了 这 些 机 器 级 编程 的 背景 知识 ， 我 们 会 看 看 存储 器 访问 越界 的 问题 ， 
以 及 系统 容易 遭受 绥 神 区 溢出 攻击 的 问题 。 在 这 - -部 分 的 结尾 ， 我 们 会 给 出 -- 些 用 GDB 调试 器 来 
检查 机 器 级 程序 运行 时 行为 的 技巧 

接 下 来 是 标 了 星 号 “*” 的 内 容 ， 这 是 为 专门 的 机 器 语言 爱好 者 准备 的 。 我 们 讲述 了 1A32 对 浮 
点 代码 的 支持 。 这 是 IA32 个 非 肖 不 可 思议 的 特性 ， 所 以 我 们 只 建议 部 些 决心 磺 使 用 浮 点 代 始 的 
人 来 学 习 这 个 部 分 。 我 们 还 简要 介绍 了 一 下 GCC HE СЕНАТ ЯН. ПСЕЛ 
厅 中 ， 程 序 员 必 须 磺 用 汇编 代 公 来 请 问 机 器 的 某 些 低级 特性 。 这 时 ， 购 入 访 妨 代码 就 是 最 好 的 方法 。 


3.1 PEMA 


Intel 处 理 器 系列 的 产生 是 AEE. 不 断 进化 的 发 展 过 程 。 它 开始 于 一 个 单 芒 片 、16 位 微 处 
理 右 ， 由 于 当时 集 沽 电路 技术 水 平 十 分 有 限 ， 其 中 不 得 不 敌 了 很 多 妥协 。 只 此 以 后 ， 它 不 断 地 成 长 ， 
利用 技术 的 进步 去 满足 更 向 性 能 和 支持 更 高 级 操作 系统 的 需求 。 

КЕК ФК I ЕН ЕНЕТІН Intel 处 理 器 模型 ， 以 及 它们 的 一 些 关 键 特性 。 我 们 用 实 
Hi x Ec gh ЕЛЕК ЖЕР Ж ЖЕНЕ ЕЕ ЗЕ ЕТІ ЕК 表示 1000, 而 M 表示 1000000). 

8086: (1978, КЛЕ), КАЯШ. АЕ 27 —. 8088, UH 8086 fn Y. 
8 位 外 部 总 线 external bus》， 构 成 最 初 的 IBM 个 人 计算 机 的 心脏 。IBM 与 当时 还 很 小 的 微软 签订 
п], FA MS-DOS 操作 系统 。 最 初 的 机 器 型 号 有 32 768 РЧ ВЕТА К СТЕ ЕК 
动 器 )。 从 体系 结构 上 来 党, 这些 机 器 只 有 655 360 宇 节 的 地 址 室 间 一 一 地 址 只 有 20 位 长 ( 1 048 576 
子玉 可 被 寻 址 )， 而 操作 系统 保留 了 393 216 НАН. 

80286: (1982, 134K 个 品 体 管 )。 增 加 了 更 多 的 寻 址 模式 (有些 现在 已 经 废 疗 了 )。 构成 了 IBM 
PC-AT 个 人 计算 机 前 基础 ， 这 种 计算 机 是 MS Windows 最 初 的 使 用 平台 ， 

1386: (1985, 275K ^P S EO. RARE ERU 32 位 。 增 加 了 平面 寻 址 模式 《flat addressing 
model), Linux 和 最 近 版 本 的 Windows 系列 操作 系统 都 是 使 用 的 这 种 模式 。 这 是 Intel 系列 中 第 一 台 
支持 Unix 操作 系统 的 机 器 。 

1486: (1989，1.9M 个 蔓 己 管 )。 上 改善 了 性 能 ， 同 时 将 浮 点 单元 集成 到 处 理 器 芯片 上 ， 但 是 没有 
改变 指令 集 。 

Pentium: (1993, 31M 个 晶体 管 ?， 改 善 了 性 能 ， 不 过 只 对 指令 集 增 加 了 小 的 扩展 ， 

PentiumPro: (1995, 6.5M АЖЕ). 引入 全 新 的 处 理 器 设计 ， 在 内 部 被 称 为 P6 微 体系 结构 。 
指令 集中 增加 了 一 类 “条 件 传送 〈conditional move)" 184. 

Pentium/MMX: (1907, 4.5M 个 晶体 管 )。 在 Pentium 处 理 器 中 增加 了 处 理 整 数 向 量 的 新 指令 
类 。 每 个 数据 可 以 是 1、2 或 4 个 字 节 长 。 每 个 向 量 总 长 f. 

Pentium M: (1997, 7M 小 晶 体 管 )。 通 过 在 Po 徽 体系 结构 中 实现 MMX Ao, АТО 
E If] PentiumPro 和 Pentium/MMX 系列 。 

Pentium III: (1999, 82M 个 晶体 管 )。 引 入 另 一 类 椒 理 整数 或 浮 点 数 向 量 的 指令 ,每 个 数据 可 
以 是 1、2 或 4 个 字 节 长 , 打包 成 128 fr SIS RE. ERST TED LEGIS ГАТ, XXE EX 
的 版 本 最 多 使 用 了 24M 个 卓 体 管 。 


106 第 3 章 


Pentium 4: (2001, 42M 个 品 体 管 )。 芷 向 晶 指令 中 增加 了 8 字 节 收 数 和 浮 点 格式 ， 以 及 针对 
这 些 格式 的 144 СЕН». (Ede m TS Е, Intel 不 髓 使 用 罗马 数字 。 

每 个 时 人 疝 上 相 猕 的 处 理 器 设计 都 是 扰 向 兼 窒 的 一 一 也 就 是 ， 较 早 版 本 上 编 详 的 代码 是 可 以 在 较 
新 的 处 理 器 上 运行 的 。 正 如 我 们 会 看 到 的 那样 ， 为 了 名 持 这 种 进化 和 瞧 统 ， 指 令 集 中 有 许多 非常 柯 怪 
的 东西 。Intel 现在 称 其 带 令 集 为 LA32， 也 就 是 “Intel132 位 体系 结构 【Intel Architecture 32-bit)"。 这 
个 处 理 器 系列 也 俗称 为 “x86"， 反 陕 出 直到 i486 的 处 理 器 命名 惯例 。 


е}: (АЛІ 15862 

Intel 3 b eio ЛД kiq: ЖИЫП CPU de ed EP. XE 
FERA ата, Ев, Mure T "Pentium" 过 个 调 ， 用 的 是 希腊 词根 реша, ЖӘЙ 
这 是 他 们 的 第 五 代 机 器 。 从 此 以 后 ， 他 们 就 使 用 这 个 词 的 变 体 ， 妈 使 PentiumPro Ж ж А6 CR 
此 内 部 称 为 P6), б Pentium 4 是 第 七 代 。 每 出现 新 的 一 代 都 包括 处 理 器 设计 中 的 一 个 和 报 大 的 变化 。 





Sd: ЖАЛ (Moore's Law) 


1.0Е+0@ --------- 
1.0Е--07 


1.0E +06 
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如 时 我 们 画 出 上 面 列 出 的 各 种 1А32 处 理 器 中 品 体 管 的 元 苹 与 它们 出 现 的 年 份 之 间 的 图 ， 并 有 
使 YY 机 为 绰 体 管 数 的 对 数值 ， 我 们 能 够 看 出 ， 增 长 是 很 显著 的 。 虽 一 条 线 罕 过 这 些 数据 ， 我 们 看 到 
AE IE EU Sd KS 33 镶 的 比率 增加 ， 也 访 是 说 ,每 30 沾 月 占 体 管教 量 就 会 瘟 一 告 ， 在 ТАЗ2 的 
历史 上 ， 这 种 增长 已 经 持续 了 大 约 25%. 

1965 Æ, Gordon Moore, Intel 公司 的 创始 人 人 ， JR E SEES BUR, ИМЛЕ 
ШААНЫ АЧАЖЕ КЫ. ЖАН, МАДЖА 10 年 内 ， 毒 年 芯片 上 的 晶体管 数量 都 会 翻 一 
碍 。 这 个 预测 就 称 为 摩尔 定律 。 正 如 事实 证 明 的 那样 ， 他 的 预测 不 仅 有 点 乐观 ， 而 且 太 直 视 了 .在 
它 四 十 多 年 的 历史 里 ， 半 导体 工业 能 够 每 18 AARRE i. 

对 计算 机 技术 的 其 他 方面 ， 也 有 类 似 的 芋 指 数 性 增长 的 情况 出 列 ， 比 如 磁盘 容重， 存储 圳 芯片 
容量 ， 和 处 理 器 性 能 。 


这 些 征 来， 有 儿 L 家 公司 生产 出 了 与 tel 处 理 器 兼容 的 处 理 器 ,它们 能 够 运行 完全 相同 的 机 器 级 
笠 序 。 其 中 ， 领 头 的 是 AMD 公司 。 数 年 来 ，AMD 的 策略 一 直 是 在 技术 上 紧 跟 在 Intel 后 面 ， 生 产 
性 能 宵 低 但 是 价格 更 便宜 的 处 理 器 。 最 近 ，AMD 已 经 生产 出 了 一些 顶级 性 能 的 IA32 处 理 器 ， 这些 
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КЕНЕ ЭЖЕЕ ЧЕН] ЧИКА 1С 时 钟 速度 门槛 的 。 盟 然 我 们 会 谈 到 Intel АА, {НДА 
些 描述 对 Intel 的 竞争 对 手 生 产 的 兼容 处 理 器 也 问 样 适用 。 

对 由 GCC 编 详 器 产生 出 的 、 运行 在 Linux ИЕ ЕРЕ ЕКЕН, WC BRI À LM SH 1А32 
复杂 性 的 大 部 分 ， 最 初 的 8086 中 的 存储 器 模型 和 它 在 80286 中 的 扩展 部 已 经 过 时 了 。 作 为 替代 ， 
Linux 使 用 了 平面 导 址 方式 (flat addressiag)， 在 这 种 寻 址 方式 中 ， 程 序 员 将 整个 存储 定 间 看 做 一 个 
XI EH RGB. 

从 列 出 的 发 展 过 程 中 ， 我 们 可 以 看 到 ，IA32 中 加 入 了 很 多 处 理 小 整数 和 浮 点 数 向 量 的 格式 和 指 
令 。 增 加 这 些 特性 是 为 了 提 遍 多 媒体 应 用 程序 的 性 能 ， 例 如 图 像 处 理 、 音 笑 和 祝 腹 编码 和 解码 ， 忆 
及 三 维 计 算 机 图 形 。 不 幸 的 是 ， 日 前 版 本 的 GCC 产生 药 代 码 不 会 使 用 这 些 新 特性 。 实 际 上 ， 在 黑 
А Ау F, GCC 会 假设 它 是 为 一 个 1386 机 器 产生 代码 ， 编 详 器 不 会 试图 司 用 许多 褒 加 到 现在 
看 来 已 经 非常 老 的 体系 结构 的 扩展 特性 。 


32 程序 编码 
ЕВС ЖР, НИТ УЙЕ ple 和 P2.c。 然 后 我 们 用 Unix ОТА EL TUI: 


unix» qcc -O2 -o p pi.c р2.с 

命令 gcc 表明 的 就 是 GNU C HESS GCC。 因 为 这 是 Linux ЕРЛАН, ВАН PF WA f 
地 用 CC жа. Ж-О 告诉 编译 器 使 用 第 二 级 忧 化 。 通 和 芝 ， 提 高 优化 级 别 会 司 量 终 程序 
运行 得 更 快 ， 但 是 编 洋 时 间 可 能 会 变 长 ， 对 代码 进行 调试 会 更 困难 。 第 二 级 优化 屁 性 能 优化 和 使 用 
方便 之 间 的 一 种 很 好 的 妥协 。 本 书 中 所 有 有 的 代码 都 是 用 这 个 优化 级 别 进行 编 详 的 。 

这 个 铅 令 实际 上 调用 了 一 系列 程序 ， 将 源 代 码 转化 成 串 热 行 呈 码 ， 首 先 ，C 牟 处 理 器 会 扩展 源 
RE, WANA Hnd 命令 指定 的 交 件 ， 并 扩展 所 有 的 宏 。 上 其次， 编译 器 产生 两 个 源 文件 的 沪 
编 代 三 ， 名 字 分 别 为 pl.s 和 pP2,s。 接 下 来 ,汇编 器 会 将 汇编 代码 转化 臧 一 进 制 目 标 代码 文件 pl.e 和 
p2.0。 最 后 ， 链 接 器 将 两 个 目标 文件 与 实现 标准 Unix РАЙ (例如 prim. 的 代码 合并 ， 并 产生 最 
终 的 可 执行 交尾。 我 们 会 在 第 7 章 中 更 详细 地 介绍 链接 ， 


3.2.1 机 器 级 代码 
在 整个 编译 过 程 中 ， 编 详 器 会 完成 太 部 分 的 工作 ， 将 把 用 立 提供 的 相对 比较 抽象 的 执行 模型 表 
示 的 程序 转化 成 处 理 器 执行 的 非常 基本 的 指令 。 汇编 代 码 表示 非常 接近 于 机 器 代码 。 与 召 标 代码 的 
一 进 制 格式 相 比 ， 汇 编 代码 的 主要 特点 是 用 可 读 性 更 好 的 文本 格式 表示 的 ， 能 够 理解 汇编 代码 以 及 
HEAS RRA С 代码 相对 应 的 ， 是 理解 计算 机 如 何 执 行程 序 的 关键 一 步 。 
汇编 程序 员 看 到 的 机 器 与 C 程序 员 看 到 的 机 器 差别 很 大 ,一 些 通 常 对 C TREE АШ ЛЕЛЕ ИҚ 
dax fe n] RII 
. КЕНИЯ (Клбер) 表示 将 要 执行 的 下 一 条 指令 在 存储 器 中 的 地 址 。 
e ”整数 寄存 器 文件 包含 8 个 被 命名 的 位 置 , 分 别 存储 了 2 位 的 值 ,这 些 寄存 器 可 以 存储 地 址 (对 
FV T C 的 指针 ) 或 整数 数据 。 有 的 寄存 器 用 来 记录 某 些 重要 的 程序 状态 ， 而 其 他 的 寄存 器 
用 来 保存 临时 数据 ， 例 如 过 程 的 局 部 变量 。 
. 条 性 码 寄 存 器 保存 着 最 近 执 行 的 算术 指令 的 状态 信息 。 它们 用 来 实现 控制 流 中 的 条 件 变 北 ， 
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比如 说 图 来 实现 过 或 while 语句 ， 

. PARTALAR 8 个 位 置 ， 用 来 存放 浮 点 数据 

昌 然 CC 提供 了 一 种 模型 ， 可 以 在 存储 器 中 声明 和 分 权 各 种 数据 类 型 的 对 和 象 ， 但 是 汇编 代码 只 是 
简单 地 将 存储 器 香 成 :个 很 大 的 、 按 字 节 寻 址 的 数组 。C 中 的 党 集 数据 类 型 ， 例 如 数组 和 结构 ， 在 
汇编 代码 中 是 用 连续 的 字 节 珍 示 的 。 即 使 是 对 标量 数据 类 卉 ， 汇 编 代码 也 不 区 分 有 和 罕 芒 或 无 符号 整 
数 ， 不 区 分 各 种 类 地 的 指针 ， 甚 至 于 不 区 分 指针 和 整数 。 

程序 仓储 器 (program memory) ЗВ) НМЕ, RIRA ЕНЕ. НЕ ЕЕ 
称 调 用 和 和 返 呵 的 运行 时 栈 ， 以 及 用 户 分 配 的 存储 器 块 【 比 如 说 用 таЛос ЕЖ ИЕНІ). 

程序 存储 器 是 用 虚拟 地 址 来 寻 址 的 。 在 任意 给 定 的 计 刻 ， 只 有 有 有限 的 一 部分 虚拟 地 址 是 侣 法 的 ， 
Ші, А TA32 的 了 2 位 地 址 可 以 寻 址 AGB 的 地 址 范围 , 但 是 一 个 通常 的 程序 只 会 访问 几 M FTV, 
操作 系统 负责 管理 虚拟 地 址 空间 , REI PULS BE FE BR А Sc s VERE SE TT SS (processor memory) 中 的 物 
BEN. 

ЖаН е ЖАНЕ. ӨШ, BPB Tr SETS КҮЙІНДІ, A 646454 
АТ In SE. КЕЖЕУРЕК ИІНІНІҢ» МН. ҚҮРАЛ ЕЕЕ ЛЕЙ, ЖІП 
ОНА ЖСН. ТЕКО ЛИН НБ [аро РЕНО Fe FREE YS. 


32.2 代码 示例 
ud ГАУСС codec, ЧТЕНИЯ. 


int accum = 0: 


1 
2 
3 int sum(int x, int y) 
4 | 
5 її E = x + y; 
Б accum += t; 
7 return t; 
B ) 
在 命令 行 RH “-5” PR, MER E САНЕ Е НС N: 
unix» gcc -022 -5 сойе,с 
这 会 使 编译 器 产生 一 个 汇编 文件 code.s， 但 是 不 做 其 他 进一步 的 工作 《通常 情况 下 ， 它 还 会 调 
用 汇 纳 器 产生 日 标 代码 文件 )。 
GCC 中 按照 它 目 己 的 格式 产生 汇编 代码 的 , 这 种 格式 称 为 GASCGm ASsembler, GNU 汇编 器 )。 
我 们 的 讲述 是 基 上 这 种 稿 忒 的 ， 它 同 Intel 文档 中 的 格式 以 及 微软 编 详 器 使 用 的 格式 差异 很 人 。 从 参 
者 文本 说 明 中 可 以 获得 关于 如 何 找到 各 种 汇编 代码 格式 妆 档 的 建议 。 
nf RE PR ЕН, BLEE КІЛТ ч: 
ian z 
push} *ebp 
movil £esp,tebp 


movl l12i*ebp),£eax 
addl B(€&ebp),€*eax 
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addl £€eàax,aàaccurm 
movi %ерр,%евр 
popl &ebp 
ret 
上 面 代码 中 每 个 缩 进 去 的 行 部 对 应 于 一 条 机 器 指令 。 比 如 ，Ppashnl 38 p K PE А АЛТ ерр 
的 内 容 硅 入 程序 栈 中 。 这 段 代 码 中 己 经 除去 了 所 有 关于 局 部 变量 名 或 数据 类 型 的 信息 ， 但 我 们 还 是 
看 到 了 一 个 对 全 局 变量 accum 的 引用 ， 这 是 因为 编译 器 还 不 能 确定 这 个 变量 会 放 在 存储 器 中 的 哪个 
(М. 
如 果 我 们 使 用 “-e” 命 令 行 选项 ，GCC 会 编译 并 汇编 该 代码 : 
unix» gcc -О2 -C code.c 
itu = = НАШЕ codeo, = Ж ЕНЕ НОЈ, rl ik АНЕ. 852 字 节 的 文件 code.o 
中 有 一 段 19 字 节 的 十 六 进 制 表示 的 序列 ， 
55 89 е5 Bb 45 0с 03 45 08 01 05 20 00 00 00 89 ес 5d c3 
ММТ КЕЛІНГЕН BE. AEST EG RUE. ПАСТА Te 
ЕДЕЛ-АЯЛЕФИ ТА БЕЗ]. ПЖ АРЕ ЗЕ АЕ АИ ЛЗР. 
ut КИЧНЕ а 
Ұл, ЗПЛАЛАБ (НОЛ ЖӘН) ЖАХ SË som 的 代码 长 是 19 T%. NUS. AD 
在 文件 code.o 上 运行 GNU Ж дт. GDB, r4 
(gdb) x/i9xb sum 
ikf44-E-yt СОВ Ede ( M 2 "x^ 219 EXGEBEA CURA TT UA 4"). 
ВЖ, GDBGXRSOOAB VHHOTEUR KAPIDREMUCSUT, ДАФ 3.12 节 中 讨论 过 个 问题 ， 


ы НҢ КИ ЕАР, god] RC SS (disassembler) 的 程序 的 价值 无 法 估量 ， 这 
些 程序 根据 目标 尺码 生成 -一 种 类 羽 于 计 . 编 代码 的 格式 。 和 在 Linux RAP. п “а” ТАЛЫ 
PF OBJDUMP (AR "object dump”》 可 以 充当 这 个 骨 色 ， 

unix ор7йитр -d code.o 

结果 是 “这 里 ， 我 们 在 去 按 增加 了 行 导 ， 人 在 右边 增加 me 


Disassembly of function sum in file code.o 
| 00000000 <sum>; 


Offser Bytes Equivalent assembly language 
2 OÜ: 55 push $ebp 
3 : 9 е5 mov &esp,*ebp 
4 3: b 45 Oc mov Üxci*ebpl,t*eax 
5 6: 03 45 ОВ адаа 0х8 {(%ерр), +еах 
6 9: 01 05 00 00 00 09 add $eax, ÜXI 
7 t: 89 ec mov $ebp,t*esp 
8 11: 54 рор терр 
g 12: cy ret 
10 13: 99 nop 
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讶 左边 ， 我 们 看 旬 捧 照 前 自给 出 的 子 节 顺序 排列 的 19 个 十 六 进 制 字 节 信 ， 它 们 分 成 了 一 些 组 ， 
每 组 有 1~6 TFT S27 一 条 指令 ,市 边 是 等 价 的 汇编 诸 言 。 其 中 一 些 特性 值得 涪 明 ， 


IA32 ES REA 1 一 15 ^p E SE. 指令 编 码 被 设计 成 司 常 败 的 指令 以 及 操作 数 较 少 的 指 
令 所 所 的 字 节 数 少 ， 而 那些 不 太 常 用 或 操作 数 较 和 多 的 指令 所 需 学 节 数 较 多 。 
指令 格式 是 按照 这 样 种 方式 设计 的 ， 从 某 个 给 定位 置 开 始 ， 可 以 将 字 节 惟一 地 租 码 成 机 
器 指令 ， 例 如 ， 只 有 指令 pushl Феһр 是 以 字 节 值 55 开头 的 ， 

及 扎 编 器 内 是 根据 日 标 文 件 中 的 字 节 序列 来 确定 汇编 代码 的 。 它 不 需要 访问 程序 的 源 代 码 
或 汇编 代 但 。 

BRL Ses EH PUTET dr Д GAS 使 用 的 有 些 细微 的 差别 。 在 我 们 的 示例 中 , CAR / 
很 名 指令 结尾 的 “1”， 

Ң code.s 中 的 汇编 代码 相 比 ， 我 们 还 发 现 结尾 多 了 -条 nop 指令。 这 条 指令 根本 不 会 被 执行 
Ce x SOR HR S JO. 即使 执行 了 也 不 会 有 任何 影响 (所 以 称 之 为 пор, 是 “no operation” 
的 简写 ， 通 常 起 作 “no op 沁 。 编 译 器 插入 这 样 的 指令 是 为 了 填充 存储 该 过 程 的 空间 。 


生成 实际 是 执行 的 代码 害 要 对 组 目标 代码 文件 运行 链接 器 ， 而 这 一 组 日 标 代 码 交 件 中 必须 仿 
有 一 个 main 83. 假设 在 文件 maine PA TERE RAM: 


1 
2 
3 
4 


inL maini) 
Í 


returr sumí(l, 3); 
) 


然后 ， 我 们 用 如 下 方法 生成 叮 执行 文件 test: 
unlx> gcc -02 -o prog code.o таіп.с 


文件 prog EAT 11667 #17, ЯУЕМИНАЕЕПЕИЯ АНЕ, ЕДА T FERE zn le 
1 程序 的 信息 ， 以 及 用 来 与 操作 系统 交互 的 信息 。 我 们 也 可 以 反 汇 编 prog ХЕ: 


unix» objdump -d prog 
反 汇 编 器 会 抽取 出 备 种 代码 序列 ， 和 包括 下 面 这 段 ; 


1 
2 
i 
4 
= 
E 
jd 


10 


Disassembly of function sum in executable file prog 
080483b4 «sums»: 


8048314: 55 push %ерр 

80483Һ8: — 89 е5 mov kesp,*ebp 
04830: Өс 45 бс тоу Üxcítebp)],t*eax 
80483ba: 03 45 08 add óxB(tebpl,$eax 
8048ара: 01 05 64 94 04 DE add Зеах,02х80494654 
804833: 89 ec mov tebp, esp 
80483с9: 5g Dop tebp 

804836: еЗ ret 

aü0dB3c7: 90 пор 


注意 ， 这 段 代 码 与 codec 反 拒 编 产 生 的 代码 儿 乎 完全 Pe — TEWE IEA НАН 


А [ii] 





БЕЕН СВО НЕДЕ $0 — ERIS НЕ HL BEER. BOARA АМ ТЕРЕ PE ҮЙ 


全 局 变量 accum 的 地 址 。code.o 反 汇 编 代码 的 第 6 行 中 ，accum 的 地 址 还 是 0。prog 的 反 汗 编 代码 


程序 的 机 路 级 表示 Н 


由， 地 址 就 设 成 了 0x8049464。 这 可 以 从 指令 的 汇编 代码 格式 中 看 到 ， 还 可 以 从 指令 的 最 后 四 个 字 
ЗЕ, ЫНЫ УЙ ЇЙ 64 94 04 08. 


323 ”天 于 格式 的 注解 
GCC 产生 的 汇编 代 个 有 点 难 读 ， 它 包含 一 些 我 们 不 需要 关心 的 信息 。 男 外 ， 它 不 提供 任何 程序 
"ibm ЖОШ ТАЕНЕ. ш, BEX simple.c t Р ЖМА: 


1 int simple(int *xp, int у) 
2 { 

3 int t = *хр + v: 

4 *хр = t; 

5 return t; 

Š I 


当 市 选项 “-S$” 运 行 ӨССЕ, ЕРЕ РАВУ: simples: 


file "simple.c" 

.version "01.01" 
асс2 compiled. : 
.LexL 

-align 4 
.globl simple 

‚суре simple,&function 
simple: 

push: *ebp 

movl Февр, %ерр 

movl 8(%ерр}, %еах 

movl ($eax],&edx 

addl 12 (%ерр), %едх 

movil *edx,í*eax) 

movl $edx,*e6ax 

movl $ebDp,S*esp 

popl ebp 

гер 
,Lfel: 

Size Simple,,.Lfel-simple 

.ident "ЄСЄ: (GNU) 2.95.3 20010315 (release)l" 


文件 包 洛 的 信息 多 于 我 们 实际 需要 的 。 所 有 以 “.” 开 头 的 行 都 是 指导 汇编 器 和 链接 器 的 命令 
(directiye )， 不 过 我 们 通常 可 以 忽略 这 些 行 。 男 一 方面 ， 也 没有 关于 这 些 指令 是 十 什么 用 的 以 及 它 
们 3 源 代 码 之 间 关 系 的 解释 说 明 。 

为 了 更 清楚 地 说 明 汇 编 代码 ， 我 们 将 给 出 汇编 代码 的 格式 ， 包 括 行 号 和 解释 性 说 明 。 闪 于 我 们 
的 小 例 ， 带 解释 的 汇编 代码 是 像 下 面 这 样 的 


1 simple: 

2 pushl $ebp Save frame pointer 

3 movl %еѕр, %ерг Create new frame pointer 
4 movl В(Жерр),%еах Get xp 

5 movl {Феах), %ейх Кетеуе *xp 


2 яз% 


Б ада1 l21%ebp) ,%edx — Addyto get! 

7 movl *%edx,(%*eax) More t at *xp 

ü movl %ейх,%аах Set t as return value 
9 movl €ebp, t*esp Reset stack pointer 

10 popl &ebp Reset frame pointer 
11 ret Return 


йе ПАШ ЕРНАР THBX THO. т Е edem. ЖЕНЕ, 
简单 地 描述 指令 的 效果 以 及 它 与 原始 C 代码 中 的 计算 操作 的 关系 。 这 是 一 科 汇 编 语言 程序 员 写 代码 
i] URS o 


33 数据 格式 


由 于 是 从 16 ЖЕНГЕН 32 (rf, Intel ARE “F Cword)" 表 水 16 位 数据 类 型 。 央 此， 
称 32 何 数 为 “ 双 字 (double words)”, # 64 位 数 为 “四 字 (апай words)”. BITER RIHIA $ Arih 
令 都 是 对 子 节 或 双 子 操 作 的 。 

图 3.1 给 出 了 对 应 C 基本 数据 类 型 的 机 器 表示 。 注 意 ， 人 多 数 常用 数据 类 型 都 是 作为 双 字 存储 
的 。 其 中 ,包括 普通 整数 (it) 和 长 整数 【long inty， 无 论 它 们 是 否 有 符号 。 此 外 ， 所 有 的 指针 【在 
此 用 char * 表 小 } 都 是 4 字 节 的 双 字 。 处 理 字符 串 数据 时 ， 通 常用 到 字 节 。 浮 点 数 有 -= 种 形式 ; W. 
Ж Са) 但 ， 对 应 于 C 数据 类 型 float， 双 精度 ‘8 A) (8. ww C 数据 类 者 double: ЖІ 
扩展 精度 dox. ОСС 用 数据 类 型 long double ЖЖЖ ЕНЕҢ шін. Tim 
RANTE: ЕНЕ а ЗЕЕВА ЕА 12 字 节 数 ， 符 会 儿 我 们 会 讨论 这 个 问题 BA ANSI C 标准 
包括 long double 数据 类 型 , 伯 是 对 大 多 数 编 译 器 和 机 器 组 合 来 说 , 它 的 实现 和 普通 double HJ 8 £ fi 
格式 是 一 样 的 ， 对 GCC 和 1A32 的 组 合 来 说 ， 支 桂 扩 展 精 度 是 很 少见 的 。 


Fi b 


char 

Short 

пі 

unaigned 

опу int 
ansigned long 
char * 


Ë loat 


| 
2 
4 
4 
4 
4 
$ 
4 


doube 


THI 


long double 





图 3.1 标准 数据 类 型 的 大 小 


如 图 3.1 所 示 ，GAS 中 的 每 个 操作 都 有 一 个 子 符 后 缀 ， 表 明 操 作 数 的 大 小 。 例 如 ，mov 【传送 
ЖҮЙ) 指令 有 一 种 形式 ，imovb【 传 送 字 节 7)、moww【 传 送 字 》 和 movi (EERE). Ka “1° 用 来 
表示 冯 字 ， 因 为 存 许 多 机 器 上 ，32 位 数 都 称 为 “长 宁 {long word)”, 这 是 沿用 以 16 位 学 为 标准 的 


£f E BR Ae _ ИЗ 
时 代 的 习惯 造成 的 ， EE, GAS НЕН "I" KANER 4 字 节 的 整数 和 上 字 节 的 双 精 度 浮 点 数 ， 
这 不 会 产生 上 放 久 ， 因 为 漳 点 数 使 用 的 是 一 组 完全 不 同 的 指令 和 害 存 器 。 


34 raf m. 


— AR disp ROS (CPU) f Ж HAE рін, ПЕН КИЮ 
ХИ НЕЕ. З лк ТД ЛЖ. ETE ESSERI TELE. ЧЕП ЕЕН ЕЕ 
T. {ТЕД eos h, ЖШ 16 (780. ЧЕН. RERO EE ACIER RED Bh Hi 
ЕН. (ЕТІН), ЭКИН НЕ КШ ЕТ. EXC EHE тт. WA AEMT 
以 看 成 通用 寄存 器 ， 对 它们 的 使 用 没有 限制 , SITE EX ENNIO, ЕНШІ 
的 寄存 器 作为 源 和 /或 目的 的 。 另 外 ， 在 过 程 (procedures) Ah, HAAR (%сах. %есх 
сах) 的 拱 存 和 恢复 情 钢 将 不 同 于 接 下 来 的 三 个 害 存 加 [Eebx、 加 edi ее», ЖІП 3.7 0 
ПАША. ЖЕҢЕТ ГЕ (ebp Resp) 保存 着 指向 程序 机 中 重要 位置 的 指针 ， 只 有 要 
玫 乒 管理 的 标准 情 例 才能 收 改 这 两 个 寄存 器 中 的 值 ， 





Е22 БЕШ 
шыта Xr Fr OQ) ТІЛЕГІ ИНИТ Ы ТЕЗ 


ШЕ 3.2 Вэ. ETHER A EI ELM ӨЕ ЖН ИЩ НЕЕ ЫН ЕЗ. 2086 中 提供 
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这 样 的 特性 是 为 了 后 辐 闽 容 8008 和 8080, 8008 和 8080 JEUX n] EB XR SI 1974 平 的 微 处 理 器 ， 妆 
-… 条 宁 节 指令 更 新 这 些 单字 节 “ 窜 存 器 元 素 ” 中 的 一 个 时 ， 该 寄存 器 余下 的 三 小 字 不 会 被 改变 。 
类 似 了 下 ， 字 操作 指令 可 以 读 或 者 写 每 个 寄存 器 的 长 16 位 。 这 个 特性 源 自 ТАЗ2 是 从 16 МІНЕ 
演化 而 来 的 。 


34.1 ЖЕТА 

大 多 数 指 令 有 -- 个 或 多 个 操作 数 【 operand)， 指 水 出 执行 一 个 操作 中 慨 引 用 的 涉 数 据 仁 ， 以 及 
放置 结果 的 号 的 位 置 。IA32 X5 НЕН (图 3.3)。 源 数 据 什 可 以 以 常数 形式 给 出 ， 或 是 从 
寄存 器 或 在 情 器 中 读 出 ， 结 果 可 以 存放 在 寄存 器 或 存储 器 中 。 因 此 ， 各 种 操作 数 的 可 能 性 锌 分 为 一 
种 类型 。 第 - -种 是 立即 数 【iminediate》， 也 就 是 常数 值 。 在 GAS P., RHEE C RRRA АЛЛ 
数 的 书写 方式 是 “$” 后 面 跟 一 个 整数 ， 比 如 ，$-573 或 $0x1F。 任 何 32 位 的 字 孝 可 以 用 佑 立即 数 ， 
不 过 汇编 器 在 可 能 时 会 使 用 一 个 或 丽 个 字 节 的 编码 。 第 二 种 类 型 是 寄 站 器 ( Tegister )， 它 表示 某 个 
寡 存 器 的 内 容 ， 对 双 字 操作 来 说 ， 可 以 是 人 个 32 位 寄存 器 中 的 一 个 《如 名 sax ә), ТЕЖО, 
可 以 是 八 个 单 学 节 害 存 器 元 素 中 的 A Са), 在 我 们 的 图 中 ， 我 们 用 符号 E。 来 表示 任意 寄存 器 
а, АЭ R[E,I 来 表 水 它 的 值 ， 这 是 将 寄存 器 集合 看 成 一 个 数组 R， 用 寄存 器 标识 符 作 为 索引 。 

第 二 类 操作 数 蚌 在 嵌 器 引用 ， 它 会 根据 计算 出 来 的 地 址 通常 称 为 有 效 地 址 ) Vi fe RT EE 9 
位 置 。 因 为 将 存储 器 看 成 :个 很 大 的 字 节 数组 ， 我 们 用 符号 Mi[Addn 表 未 对 存 信人 在 下 储量 中 从 地 址 
Addr 开 奶 的 户 字 节 仁 的 引用 ， 为 了 简便 ， 我 们 通 第 省 去 写 在 下 方 的 b。 

ШП 33, 有 多 种 不 同 的 村 址 模式 ,人 允许 不 同形 式 的 存 情 器 引用 , Е АНУ Imm(E,, Е, 3) 
是 最 通常 的 形式 。 这 样 的 引用 有 由 个 部 分 ; 一 个 立即 数 偏 称 Imm， 一 个 基 址 寄存 器 EE， AE 
索引 寄存 器 E; 和 一 个 伸缩 因子 (scale factor) s. AE s 必须 是 1、2、4 或 者 B88。 然后， 有 笋 地 址 被 
计算 为 Imm + RIE + RIE] ' s。 引 用 数组 元 素 时 ， 会 用 到 这 种 通用 形式 。 其 他 形式 乓 是 这 种 通用 形 
式 的 特 踊 情况 ， 省 虞 了 菜 些 部 分 。 正 如 我 们 将 看 到 的 ， 当 引用 数组 和 结构 元 素 时 ， 比 较 复 杂 的 寻 址 


模式 是 很 有 用 的 。 
一 wa е 
ССНИ СНИ - 
ава 
M[fmm] ялан 
(E) M[R[E;I! 间接 子 址 


Imm Ер) M[Dmnma R| El] Cree RO dur 


(Ep, E) MIR E: КЕ ІІ AF Hl 
Imm(E,, E) MEmm-R[IEARIE;! d Hr 
LERS) М[Е[Е,]-5] КЕИ m ЖӘНЕН 
immi, E, в) M[imm+R[E;] :s] р ep e hp a hr 
(Ер, E,, S) M[R[E S R[E,] -5] ARAA AS BE 3 HL 
ImmíE,, E, 5) MpInm-R [Ej] R[E,] >) BM Ba do gu de НЕ 


图 3.3 ”操作 数 格式 
操作 数 可 以 表示 立即 数 (常数) ЧА. Giaa Krisi. НЫН F GAEI 2. ARES 





Жа k = _ [15 





练习 是 3 1 е 
а түтүү 
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342 数据 传送 指令 
最 频繁 使用 的 指令 是 执行 数据 传闻 的 指令 ， 换 作 数 符号 的 通用 性 使 得 一 条 简单 的 传 关 指 仿 能 名 完 
成 评 训 机 器 中 要 和 好几 条 指令 才能 完成 的 功能 ， 图 34 列 出 的 是 一 些 重要 的 数据 传送 指 他 ， 最 常用 的 是 
TEREN movi 指令 。 源 操作 数 指定 一 个 值 ， 它 可 以 是 立即 数 ， 可 以 存放 在 寄存 甸 中 ， 也 可 以 存放 
ТЕР. 目的 操作 数 指 定 一 个 位 置 , 它 可 以 是 寄存 器 , 也 可 以 是 存 情 器 地 址 。 IA32 加 了 一 条 限制 ， 
人 心地 外 全 的 两 个 拘 必 数 焉 能 那 指 向 存 全 器 位 置 。 将 一 个 值 从 一 个 存 情 器 位 置 排 到 另 一 个 存储 器 位 置 需 
监 两 条 指导 一 第 一 条 指 似 特 淹 值 加 载 到 寄存 器 中 ， 第 二 条 特 读 害 存 器 值 写 入 目的 位 置 . 
PART movi 指 他 示例 给 出 了 源 和 目的 类 型 的 五 种 可 能 组 音 。 回 想 一 下 ， 第 一 个 是 潭 操作 数 ， 
ШЕННЕН. 
movi 5054050, %вах Immediate --Begiswr 
movl &ebp,t*esp Register Register 
тоу] i*edi,*ecx],teax — Memory-Register 
movl $-17,{%еяр] Immediate--Memary 
movl *eax,-12(*ebp) Register. Memory 
movb ffi Ro, TERREA. 5— HENCE HEB. USER HA 
下 的 八 个 单字 节 审 存 器 元 素 中 的 一 个 。 类 但 地 ，moww fll GEI. SENARRA 
存 器 时 ， 它 必须 是 图 3.2 中 所 示 的 作 个 两 字 节 寄存 可 元 素 中 的 一 个 。 





И d n ыз н 


H6 %з% 









поу2Е1 D 一 *#F (59 
pushi 5 Risesp] — Ё[%евр]-4; = 
M[RI*esp]] — $ 
К|%евр!|! 一 зерна 
图 34 数据 传送 指令 
movsbl 和 movzbl 指令 负责 拷贝 一 个 字 节 ， 并 设 午 悍 的 操作 数 中 其 余 的 位 。moyshl TRAP T V Be 

作 数 是 单字 节 的 ， 它 执行 符 与 扩展 到 32 位 《也 就 是 , 将 高 和 位 设置 为 源 字 节 的 最 局 位 )， 然 后 拷贝 
到 双子 的 日 的 中 。 类 似 昌 ，movzbl 指令 的 源 操作 数 是 单 学 节 的 ,在 前 面 加 24 7 03 83932 hr, H 
将 结果 拷贝 到 问 宁 的 日 的 中 ， 
Ж. xni v ELLE 


仔细 观察 可 以 发 现 ， 三 个 字 节 传送 指令 movb. movsbi 和 movzbl 之 间 有 细微 的 着 别 。 这 里 有 一 
个 示例 ; 








WRI %dh = 8D, %eax = 98765432 


1 movb %@Н,%а]} Фегах = 9875548) 
2 movsbl €dh, %еах Фейх = FFFFFFAD 
3 movzbi Жаһ,%еах Oeax = 0000008р 


ERLERNTE, ЖАЛА Ж ea HARFLE ed 的 第 二 个 字 季 。movb 指令 不 改变 
ЕЕ ЛАЯ, ВЕНУ И, по J&4- MC APER | 340. movzbl 指令 无 
论 如 何者 是 特 其 他 三 个 字 节 设 为 全 0. | 


ЖН PAP GRE HOS E ТЕЛЕН ЖЕ ИЕЛ EPA ЖЕ ЗДЕРІ. ІНГІ 10. RE 
处 理 过 程 调用 中 起 到 罕 关 重要 的 作用 。Pushl 和 рор! 35-93 — BHE3E— 9H T TA ИН 
和 用 本 弹出 的 中 的 数据 。 程 序 栈 存 放 和 在 存储 器 中 某 个 区 域 。 如 图 3.5 Bp, Hen] PIRE, XXPEÉ— X, 
栈 顶 元 素 的 地 址 是 所 有 栈 中 元 素 地 直 中 最 低 的 。( 根 据 惯 例 ， 我 们 的 栈 基 倒 过 来 画 的 ， 栈 “项 ”在 图 
КН.) 栈 指针 名 esp 保存 着 栈 质 元 素 的 地 址 。 将 一 个 双 字 值 讨 入 栈 中 ， 首 先 要 将 栈 指针 减 4， 然 
后 将 值 写 到 新 的 栈 质地 址 。 因 此 ， 指 令 push Феһрр 的 行为 等 价 于 下 面 这 样 酚 条 指令 ， 

qub] 54,Фез 

Су 1 ер, (esp) 

它们 之 间 的 区 别 基 在 日 标 代 码 中 pushl 指令 是 编码 为 ЕКІН LINA RSS 355€ 6 
个 学 节 。 图 中 前 两 栏 给 出 的 是 当 %esp 为 0x108 #l%eax 为 0x123 时 ， 执 行 指令 pushl wear 的 效果 ， 
首先 %esp 会 三 4， 得 到 0x104， 然 后 会 将 0x123 存放 到 存储 器 地 址 Ox 104. 处 。 

阐 出 一 个 双 字 这样 的 抒 作 将 包括 从 栈 顶 位 置 读 出 数据 , 然后 将 栈 指 针 加 4。 因 此 , 指令 popl Феах 


LI + 117 


WI T Fm PEB АНЫ. 
mavl {%евр),%вах 
addl 54, %евр 
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图 3.5 HERE 
RC. RUE IEIN ЖР. ТЕКЕ "ЛҮ" ТЕКИ. ТА ELE ER УНЕ, LIRIK REM B htt (ЕН гер! 
ЕНІ. FRATAR H. RHB U thi bit, ЕНИН. 


PH 35 的 第 三 栏 说 明 的 是 在 热 行 完 push 后 立即 执行 指令 рор! ах 的 效果 , 先 从 存 情 器 中 该 出 
ІҢ 0х123, УНА Т сік 中， 然后， 寄存 器 名 ep 的 值 将 增加 为 Ox108. КФ. i 0х123 
ini e mctu kw p, ANAR- AARRE ÉL АЛЕШІШ, "esp 指 同 的 地 址 总 是 
єй. 

因为 四 和 程序 乱码 世 及 其 他 形式 的 程序 数据 者 是 放 在 同样 的 存储 器 中 ， 所 以 程序 可 以 用 标准 的 
仓储 器 寻 址 方法 访问 模 内 任意 位 置 ， 例 如 ， 假 设 栈 顶 元 素 是 双 字 ， 插 邓 movl 4 1%espi Фейх $ 
WR CCTHSUEM Hoppe un pps fr Sed. 


343 数据 传送 示例 


绘 避 语言 初学 者 ， 一 些 指针 的 示例 人 
ЭЖ exchange (8 36) АЯТЕ CHERA 
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jË ë) 

Жар = y; 
正好 相反 一 一 它 将 参数 的 值 写 到 xp 所 指 的 位 置 . 这 也 是 一 种 指针 间接 引用 的 形式 【所 以 有 操作 笠 
* })， 但 是 它 表 明 的 是 一 个 写 操作 ， 因 为 它 是 在 栈 体 语句 的 霸 边 ， 

下 面 是 -个 使 用 exchange 的 例子 ; 


int a = 4; 

int b = exchangeí&a, 3); 
printfí("a = $d, b = %dxn", a, b); 
X UNIT PP H ; 

a = 3, h = 4 


С ЖАНЕ (ЖА ЗЫ” ЕН) НЕ ВЕ, ЖАЯТ, den G KS ES ЧЕ а 的 
ЕЖ, Қал, ЯК exchange 将 用 3 R £ ЛИЛ acp HR, DRE I 4 3 RA AK. 3 Жо 
А618 0 exchange， 它 能 修改 存在 某 个 远 处 位 置 的 敦 据 。 


code/asm/exchange.c 
int ехсһападеііті *xp, int y) 


{ 1 movl ВіЖжеБо),Феах Get xp 
int x = *хр; 2 movl 1214%ебр) ,Жейх Get y 
3 movl {%сах},%есх Get x at *xp 
*XD = ү; 4 movl Фейх, (%еах) Store у at *xD 
return x; 2 movl %есх,%еах Set x as return value 





code/asm/exchange.c 


(а) CRE (b) 让 编 代 码 


46 exchange 函数 体 的 C 和 汇编 代码 
省 虞 了 栈 的 建站 和 完成 部 分 ， 


АМЕН PIETRA SIRE, ЕВ 3.6 rn BRI UR Fi ss. BERG CHER, UE 
有 GCC ЕЮ SR fis. ЕН ТЫША АН BEL ANE. muu iu B ЖОЛЫН TU RO RT, 
ЖАТЫ А ed ec TARAR. 当 我 们 讨论 过 程 链接 时 , 2 W ЕХ ШУ qr ОЕ АО 15. 
BIR ЕЕ АИЫ, RIELA “ЫНА (body)", 

“А ЖЖ АЛАТЫН, PPE хр Ml у 存储 在 相对 于 寄存 器 免 ebp 中 地 址 值 的 偏 移 8 和 12 
的 地 方 。 指 令 1 和 2 会 将 这 些 参数 传送 寄存 器 %eax Фейх. 155 3 回 接 引 用 хр, ЖЕНА 
寄存 器 %ecx 中 ， 友 应 于 程序 值 *。 指 令 4 将 y 存储 在 хр. 指令 5 将 x 传送 到 寄存 器 %eax。 根 据 
ЕНІ, 肌 有 返回 整数 或 指针 值 的 沟 数 都 是 通过 将 结果 放 在 衣 存 器 名 eax 中 来 达到 目的 的， 因此 这 条 
指令 实现 了 C 代码 中 第 6 行 的 功能 ， 这 个 例子 说 明 movi 指令 是 如 何 咱 于 从 存储 器 中 读 值 到 寄存 
Am] GET 1 一 3)， 如 何 从 寄存 器 写 到 存储 器 的 【指令 4), ADAMA ТЕ UBI -个 
宵 存 器 的 【指令 5), 

关 十 这 上 段 汇 编 代 码 有 两 点 值得 注意 。 首 先 ， 我 们 看 到 中 所 谓 的 “指针 ”其 实 就 是 地 址 。 间 


| | у ЕК k T 119 
ЖОНИ AEA Wird. А defe ER РӨНЕ WS. Ж. 
Ix НЫША RE Me E ERU. ШЫҒЫН. rire BL И 
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HH ET. т. 

void decode] (int “хр, int *yp, int тер); 


SLIC LITN HX MEI TNT 


] movl B[tehp),kedi 
F. movl l2í(*ebp), tebx 
3 mov] 16{tebp), tesi 
4 mov] (жеді |, атах 

5 movl (&ebx|,tedx 

5 тот] (*esil,*ecx 

7 mov] *eax, (*ebx) 

Ж movil вех, (Wasi) 

9 morl Wecx,(kedli 


£8 xp. yp de zp ФН dE аср Fe EE AER. DD 和 166583. 

ЖЕЕ Ж Edid kañay decodel ñ C FG, Тыл салығын, НІНЕ. 
Tr ir Se Ж + LT PCR CEA HER ACE АИТ НЕА ESTEE PERPE). FETTET) 
FRH, 


35 WAG 


图 37 RH T EXUCEBNENIE. ВАЛЯ, АВР. Ш— ЛЕ +R 
WA. ФИ E NONSE 5S 34 节 中 使 用 的 符号 完全 相同 。 除 了 ka ШШ}, fed d GN 
的 对 学 ce fr) ТЕРЕН. EER "I 换 成 “w" 就 是 对 字 的 括 作 ， 而 换 碟 "b" & 
ӨҮСТІНЕНЕТ. МШ, addi 对 应 有 addw 和 addb. 


351 加 载 有 效 地 址 

Inti? HE: (Load Effective Address) 1839 leal 实际 上 是 mowl TIERE, (Ж И p Ert A 
只 存储 器 读数 据 到 寄存 器 ， 但 实际 上 它 根本 就 设 引 用 存储 器 。 它 的 第 一 个 操作 数 大 上皮 是 一 个 在 全 
咒 引 用 ， 但 该 指令 井 不 是 从 指定 的 位 置 读 入 数据， 而 是 特有 效 地 是 写 关 到 日 的 强 作 孝 (ns feb. 
(ЕН 3.7 中 我 们 用 C Abees 米 说 明 这 种 计算 ,这 条 指 专 可 以 用 来 为 后 面 的 存 恨 回 引用 产生 
Bir. n. En EL RICE Mu UR D ЕНЕ. n, eT bedr EF x. ЖЗ 
? leal 7[&edx, tedx, 4), boar AURET bea DIE 5х +17. ЕЖ. ИНЖЕ D 
К-Т. 

16$ 38 3.3 


ШЗ сах В x. %есх HA у, ЖТА, Td AD hik ДЫЗЫ Каз 
Вых P asik. 
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ааа рш 
leal 6í(%eax),%edx S 
СИИИ 
таа 
ЕНИН 
sa oa 
атаа [ _ 


каж гаа 












т 






ло ш i а njo Кз с |р 


Y п ou шыш ыры F 








左 移 “等同 十 sall》 
算术 刁 称 
Ңң 


图 3.7 整数 算术 操作 


加 载 有 效 地 址 fleali 指令 通常 用 来 执行 简单 的 算 表 操作 ， 而 其 余 的 指令 基 非常 标准 的 一 元 或 “元 操作 ,注意 ，GAS Н 
А ЕФ. 


35.2 ”一 元 和 二 元 操作 

第 二 类 操作 是 一 元 操作 ， 只 有 一 个 拱 作 数 ， 既 作 源 ， 也 作 日 的 。 这 个 操作 数 吕 以 是 - -个 寄存 器， 
也 可 以 是 -个 存储 器 位 置 。 比 如 说 ， 指 令 incl (besp 会 使 栈 顶 元 素 加 1。 这 种 语法 让 大 想起 怠 中 
的 加 1 运算 符 (++) 和 减 | 运算 法 (--)， 

第 三 荣 是 二 元 操作 ,第 一 个 操作 数 既 是 源 又 是 日 的。 这 种 语法 让 人 想起 С 中 像 += 这 样 的 赋值 运 
算 香 。 不 过 ， 要 注意 ， 源 操作 数 是 第 一 个 ， 日 的 把 作 数 是 第 二 个 ， 这 吓 不 可 交换 操作 特有 的 。 例 如 ， 
指令 subl %еах, %ейх у Фейх ІНІҢ МО Феах БІНЕ. Ж-А АЛЫ ЖаН. 340 
АЛЛЕН. q T HETERC n PI ЖЕ ARR EE ROLE. ЖА. ІҢ шоу] 指令 - - 样 ， 两 个 
操作 狐 不 能 同时 都 是 存储 器 位 置 ， 
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5&5] 3.4 
慨 设 下 面 的 值 在 技 查 指定 的 理 储 回 地 址 和 寄存 器 中 ， 








incl Гарс] 







ЕШ Жая, ерат 


353 ВШ Е 

ШЕ ЖАО. ЯНО, ЖЕ ДЕНА. ар И Е Е. # И 
METERA HARRIET O 到 31 ЙН. HERI CUR m НП. LEER ЕЗҮ Ж 
елын р. ШИ 37 Bon, ESOB TM FETO вай 和 shll. ЕЖЕН. MNR 
ШЛА L 0. HEAR S. sari ҖИ ЖЕН ОЙ ЕТИ), Пана АҒЫНЫ? OR F О), 


5 531 3.5 | 

Tot ds 5158 4 TEAC ARH I AR, 

int shift left2 rightníint x, int nl 

| 

"hasa - 

| 

тапа кш НӨ, ЖАБЫН RE A a Ф. kak kw ЕЕЕ ЗЕ 
а Е ЖЛ E ebp db lil 8o 12 A. 


I movi 12{tebp} , фесх (тег n 


2 movi Bí(tebp),teax rer x 
j ——"PmÓÉ— х «аа 2 
d ccm. — X 2 i= Fi 


Жаша, ЗДН Н, ЖИЙЕН. 
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354 讨论 

ER ТАЖ. BT ЗАЛ АТ S IAS ЕРЕ. АЗОН ЕНЕ ЖИ, iSi 
к Er ki Sis RETI ЕЕ КИЧ НТ A 

图 3.8 给 出 了 一 个 执行 算术 操作 的 随 数 示例 ， 以 太 它 的 汇编 代码 ， 和 前 面 ES ЖЕН 
的 建立 和 完成 部 分 ， 函 数 参 数 x. y 和 z 分 别 存 放 在 丰 赃 器 中 相对 于 寄存 路 %ebp 中 地 址 偏 移 8、12 
和 168m. 


code/asm/arih.c 

| int arithí:nt x, 

2 int ү, 

3 int z) 

4 [ 

z int tl = x-y; 

б int t2 = х*48; 

7 int t3 = L` & OxFFFF; 

б int td - t2 % t3; 

E 

10 return t4; 

11 } 

code/asm/arir.c 
(a) CRA 
1 movl 12 (%ерр), еах Gel y 
2 movl 16(%ерр),%едх бег: 
3 addl 8{%ерр},%еах Compute 1 = x+y 
d leal (Фесх, %ейх, 2), %ейх Compute z*3 
5 sall 54,%ейх Compute 12 = z*48 
6 andl $65535,&eax Compute 13 = H &OxFFFF 
7 imull %сах,%ейх Compute 14 = 1243 
a movl $edx,$eax Set td as return val 
LEN IST 
Ж 55 算术 运算 函数 体 的 C 和 汇编 代码 
нн T ЕНІ А Re CR Т. 


18723 实现 表达 式 x+y，- -个 操作 数 y АЗ сах (由 指令 | uB), ШАВА 
(hd. НУ 4 种 5 执行 计算 z*48， 首 先 司 leal 沸 邻 村 伸缩 化 的 变 址 村 址 模式 的 操作 数 执行 计算 : 
(2+ 22) 23z TERURDAT ÉBEAEAG. DIR 2 3z-48c C 编译 器 常常 用 加 法 和 称 位 指令 来 完成 
KARTERA 408 2.3.6 节 中 讨论 的 那样 。 指 令 6 执行 AND 操作 ， 向 指令 ?7 HUE RE. 
Ac. 159 8 KE PHE HAA R eax. 

EE 3.8 的 汇编 代码 中 ， 寄 存 器 %eax 中 的 值 先后 对 应 于 程序 值 y、t1 、13 和 t4 EEE, 
通常 ， 编 译 器 产后 的 代码 中 ， 会 用 一 个 寄存 器 存放 多 个 程序 值 ， 还 会 丰 寄 存 器 之 间 传 送 程序 伯 。 
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53836 — ^ 
АБЕ дүр 
For (1 = Ù; à « n; les) 

V tz 1; 


‚ш ET doit e air. 
xori *edx,todx 
ЖИА HER AU C 代码 中 没有 EXCLUSIVE-OR ( 并 点 ) ik К, ity aede dd. 
КАЗЕННЕ СНА ТФА 
355 ”特殊 的 算术 操作 
ІН 2.9 描述 的 是 支持 产生 两 个 32 СЕТИ 64 ЖШШЕ ЕЕН. 






















Rikedx|;K[&eax] — SXR[&eax] 
8 | Ritedx[:R[Weax] — S$XR[taax] _ 
Riwedx|:R|úeax] — TRÜJICMOGR[Seax[ | 
R[*tedx| = Rj*edx|:R[teax] mod 5 


їн ы @®# 
| kmpicer D Bit 







El? 特殊 的 算术 操作 
Мана Тлек екы D EE ROME HE, — HERE BR 和 和 eax 相 成 一 个 a бо ДЕР, 


B 3.7 中 列 出 的 imull ІН 875 “ЛЫҒЫ” RER, ЕЛЕР 位 的 作 数 产生 一 个 32 rb 
积 ， 实 现 了 334 和 了 35 节 中 描述 的 操作 * pAr. [IB E, "SARIRI pp 位 时 ， 无 符号 
Te EWAH RATA RH. ТАЗ2 还 提供 了 两 个 不 同 的 “ 单 操作 数 ” 巴 法 指 专 ， 以 计算 
两 个 32 Arf 4e 64 {# —— ЖЕЕ ЖН (тш). ШЙ —Л#—# ИМДЕ (иэш), 
АЙ ЖЇР KT BW ЯНЕ И «сал 中, mS THREE S ПЕНЕН ЕНІ. ЕЕ 
积存 放 在 寄存 器 %edx СО 32/0) Mea (IE 3242) qh, НЕ, ELS imull ҚҰЗЫ Т 
TERRAE ІНЕПЕНЕЕЕШІРЕІЕННЕН. Ш Н 6. 

ИПЖ ЗИТ, БЕНЕН Ж y ФРЕЕ НТР eb ЙН AGER, Ñ 
145 337418 64 yak ТҮННЕН, КІРІ ЕТТЕ ЕЕН. 


ха Фебр+й, үші Webpal? 
] movl Нізеррі,Зеах Put x in Желі 
2 imull 12[%Weahp) Мийтрї+ by у 
3 push] tedy Push high-order 32 bits 
4 pushl %еах Push low-order 32 bits 


ЕТ T- SERES ACRES, ЖАНЫ Clittle-endian) ЖЖ Ж. ІНЕ 
EIER IS BEER CUR UR, Gi EE c b HR ТТ ЕНУ). 
ПЕП ЖЕ (M 37) ЕНІНЕН (modulus) Hefe. Rol EB SES ULT h 
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操作 数 乘法 。 有 符号 除法 指令 idiv 将 寄存 器 %%edx 高 32 y) Mheas ОҚ 32 y) 中 的 64 位 数 作 为 
被 除数 ， 除 数 是 作为 指令 的 操作 数 给 出 的 。 指 令 将 商 有 储 在 寄存 器 %eax h, ЖЖ ҮГИ ТЕГ Ж 
Фейх 中 。eltd 指令 可 以 用 来 根据 寄存 器 %eax 中 存放 的 2 位 的 值 形 成 64 位 被 除数 ,这 条 指令 将 heax 
符号 扩展 到 %edx， 
让 我 们 来 看 个 例子 ， 假 而 有 符号 数 x Ay 存储 在 相对 于 %ebp 偏 移 量 为 & 和 12 的 位 置 ， 我 们 想 
SUBE му M хору rh EU EP. TUER BR 下面 这 桩 的 : 
x at Webntd, y at Фейр- 12 


ñ movi 8 (Ф%ерр), #еах Put x in eax 

2 cltd Sign extend inta %ейх 
3 idivl 12 (%ерр) Divide by y 

4 pushl %еах Push x / y 

5 push] *edx Push x % y 


divi RZ BUT АЛ УНЕ.» DRE ROLES Фейк ту A 0. 


3.6 ”控制 


到 目前 为 止 ， ПА ТИН ЖЧ АЫ ЕЖЕЛП. FRITES TR а ШОРА ДЕ 
制 被 执行 操作 的 顺序 。 对 C ЖИГЕР RS), MAU D SER RE ЙЕ, ЕНДЕЙ: 
EHE BERBUIBUF ЖАЛТ. СКЕН, Handel EIS A). Bab t] SCRI. ЖҮРЕ 
按照 非 顺序 方式 进行 ， 即 根据 程序 数据 的 值 来 确定 顺序 。 

汇 纳 代 码 提 供 了 实现 非 顺序 控制 流 的 较 低 层次 的 机 制 。 基 本 操作 是 跳 转 到 程序 的 另 一 部 分 ， 可 
能 会 视 某 些 调试 结果 而 定 。 编 谋 器 产生 的 指令 序列 是 依赖 于 这 些 低 居 机 制 来 实现 习 的 控制 结构 ， 

在 我 们 的 进 述 中 ， 会 先 谈 到 机 器 组 机制， 然后 会 治 出 如 何 用 它们 来 实现 的 各 种 控制 结构 。 


3.6.1 条 件 码 

除了 整数 寄存 器 ，CPU 还 包含 一 组 单个 位 的 条 忻 码 (condition code) #48, РІПТІ НЫҢ 
的 算术 或 逻辑 操作 的 属性 。 对 这 些 寄存 器 的 检测 , 将 有 助 于 执行 条 件 分 支 指令 。 最 有 用 的 条 件 码 号 ; 

СЕ: 进位 标志 。 最 近 的 操作 使 最 高 位 产生 了 进位 ， 它 可 用 来 检查 无 符 苇 操作 数 的 洲 出 。 

ZF; Web. BURNER UBRO. 

SF: 符号 标志 。 最 近 的 操作 得 齐 的 结果 为 负数 ， 

OF: 洲 出 标志 。 最 近 的 操作 导 店 一 个 二 进 制 补 码 溢 出 一 一 正 溢出 或 负 洲 出 ， 

С 11, AIH ада 指令 完成 等 价 于 避 RIAA tarb 的 功能 ， 这 里 变 最 as、b 和 1 ЕЕ ER 
然后 ， 会 根据 下面 的 表 过 式 来 设置 条 件 公 : 


CF: tursigned t) «(uasigned а) 无 符号 溢出 
ZF: (t == J} * 
SF; it < 0} Еа 


ОЕ: (а < 0 == b < Ü) && It < O != a < 0] c RP a d 


| 在 intel jc EE, КАБО оц. AEDA GAS fS E s Intel 钓 名字 无 关 的 情况 之 一 ， 
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leal Н ЖАНЫ ЕВО, AAE ЕНШ ЖЕМІНЕ. 5 8. 图 3.7 ТИЕТИН 
ҢЫЗ 2 ЖЇН, ATRAE, ЖШ хоп, ЖЫ КЫЛ НКЕ ИНЕ 0. wS PASE, 
HSARA Ai ARB HRD ШШДЕ А 0. 

除了 图 3.7 EE, КЕННЕН Y HERE (h 8. 1605912240 д), CIRR Ж {ЕЕ 
而 不 改变 任何 其 他 寄存 器 。 


cupb $5 58 $ -S IT 
Lt2sth 55. Ұй Ñ. & Sa: 测试 字 ñ 


CREW 5, 5; T _ 53 АЧ 
сези 34: 3| S, & 55 mE 
cmpl %, 5 84-58 Е ХИ 
кебі 80: S| А, 上 5) | ЯНА 





cmpb. cmpw 和 cmpl S da e ТИН ИЧЕ ИЗЕУ E ЖЕНЕ. A GAS AAP, ЖИН 
PFE EB ҚЫН да. ШЕМ ESOB S, fa a ЖАНЕ 1, mx 
他 的 标志 可 以 用 来 确定 两 个 操作 数 之 间 的 大 小 关系 。 

testb、testw 和 tesi] 指令 会 根据 它们 的 其 个 操作 数 的 与 САМО) 来 设置 零 标志 和 负数 标志 。 通 
常 册 个 氛 作 数 是 一 样 的 【例如 ，test1 %еах, %еах 用 来 榨 查 %eax БАЖ. ЖШ, LEIFR), Қ 
其 中 的 一 个 欣 作 孝 是 用 来 指示 哪些 位 应 该 被 测试 的 掩 二， 


3.6.2 访问 条 件 码 

两 种 最 常用 的 访问 得 件 码 的 方法 不 是 直 接 读 取 它们 ， 而 是 根据 象 件 码 的 某 个 组 合 ， 设 置 一 个 整 
数 寄 皮 器 或 是 据 行 一 条 忻 分 支 指令 。 图 3.10 中 描述 的 是 各 种 зе! 指令 根据 条 件 色 的 某 个 组 舍 ， 将 -~- 
个 平 节 设置 为 0 成 者 1。 目的 操作 数 是 八 个 单字 此 寄存 器 元 素 (图 3.2) 之 一 ， 或 是 李 慷 一 个 字 节 的 
TRA. 为 了 得 到 一 个 32 位 结果 ， 我 们 必须 对 最 高 的 24 位 清 零 。 

一 个 加 判定 条 件 【 例 如 a<by 的 典型 指令 序列 如 下 所 水 :: 


Note: a i5 in eda, b is in "peux 


1 cmpl %еах, %едх Compare агр 
2 setl %а1 Set low order byte of eax to Q or | 
movzbl Фа1, %еах Set remaining bytes of Weax to 0 


movzbl 18-4 ЖЕЗ — T SEE Ms 

ЖЕКЕН UTE. 我们 称 之 为 “ 同 义 名 synonym)”. ШЙ, “вер” C 
T “BANTU 和 “setnle"《 表 示 “ 设 置 不 小 于 等 于 ”) 指 的 就 是 同一 条 机 器 指令 。 编 译 器 和 反 汇 
ЕРЕ НТА. 

ВРТА НЕЕ ЕДТ, BERT set ОЕ ҒАН 一 种 情况 ， 执 行 
比较 指令 , 根据 计算 1=a -b 设置 条 件 码 。 例 如, 就 sete 来 说 . 即 “ 汉 相等 时 设置 (Set when equal” 
指令 。 当 a=b 人 时 ， 会 得 到 t=0， 央 此 等 标志 置 位 就 表示 相等 ， 
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кеспе setnz D— ЗЕ таа 
xd "m 
14 setnle | D= :sF^!OF)& ZF | KT (BH >) 

ATST (AAs) 

D- SF | OF ЖЕ (f<) 

0+ (aF^02) | zz 小 于 等 十 【有 符号 <=) 
setnbe ~ 7 Eu ON e 
sernb ` 超过 或 相等 【无 符 与 >= ) 
getrnae EF L8 
setna Е 会 于 或 相等 ‘万 符号 <=) 

图 310 selfie 
ШБЕҢӘНРЕНГМНЕРЕНЗ. 将 -个 字 节 设置 为 人 或 者 1。 ВЕНУ АХА" В. В ЖЕНА УТ. 


бын, ЖЕН sed, BD МАТЫ ЕН (Set when less)" 156, ШАТН В, Ча 
ҺЕН ЯҢЫМ ЛЕ, HF acb 计算 两 者 之 差 时 , 我 们 会 有 a -b<0。 当 没有 洲 出 发 生 时 ， 
符号 标 鼎 曾 位 就 表明 a<b。 当 因为 a - b 是 一 个 很 大 的 正 数 ， 出 现 正 溢出 时 ， 我 们 会 得 到 t< 0. 5 
因为 a -和 是 个 很 小 的 负数 ， 出 现 负 溢出 时 ， 我 们 会 得 到 t > 0。 无 论 是 这 两 神情 况 中 的 哪 - -种 ， 
符号 标志 都 表示 的 是 真正 的 差 的 反 。 因 此 ， 溢 出 和 符号 位 的 异 或 测试 的 就 是 a <b。 其 他 的 有 符号 比 
较 测试 是 基于 SF^ OF 和 ZF 的 其 他 组 合 。 

对 于 尤 符 号 比较 的 测试 ， 当 万 符号 参数 a 和 b ШЖ ЖЖЖ ЕИ, ӘЖЕҢ (ипв1дпед) а< 
(unsigned}b М, cmpl 指令 会 没 置 进位 标志 。 因此 ， 这 些 测 试 使 用 的 是 进位 标志 和 和 零 杯 志 的 组 全 


练习 题 3.7 


在 下 面 的 CC 代码 中 ， 我 们 用 “ ”替换 了 一 些 比较 运算 符 ， 并 且 省 格 了 强制 类 型 转换 中 的 数 
据 类 型 ， 




























serrl Do SF” OF) 













setnge 












setng 





1 char ctest(int a, int b, int c; 

2 | 

3 char 21 = а __ b; 
4 char -2 = b i ) a; 
5 char L3 = ( | c i ) а; 
Б char td = [ на! | С: 
7 char t5 = Co 5; 
Ө char L6 = a __ Ü; 
9 return t. + t2 + t3 + td + t5 + th; 
10 r 

RA С AB. GOC 产生 了 下 面 这 样 的 汇编 代码 ; 
1 їсу1 5ізеБр), Жесх (reta 

2 mcvl 12{%ерр),%ев1 Get b 

3 cmpl %ез1,%есх Compare а:ф 
4 дені %а1 Compute 1] 
5 cmpl %ecx,%esi Compare b:a 


21 


setb -li€ebp) 
стри Ct, 1b (ерт) 
setge -2 {%ерр) 
movb $ci,*di 

спро 16 {%ерр), +41 
setne %р1 

cmpl %ев1і,:-6 Зебер) 
setg -ј(%ерр) 
testi Зесх,Фесх 
setg &dl 

addb -1(жерр),%а1 
айдар -214%ерр),%а1 
addb €bl,*al 

addb -31%ерр),%а1 
addb &dl,&al 
novebl жаі, жеах 


考虑 下 面 这 样 的 汇编 代码 序列 : 
1 xor] *eax,*eax 
2 тар .L1 
3 novl (%Жгеах),%едх 
4 
5 


jmp Label 
3р *Орегапп 


Je Label 


3 P 65 1035 9 фт 


Compute 12 
Compare сга 
Cornpute 13 


Compare асс 
Compute 14 
Compare cb 
Compute 15 
Testa 
Compute 16 
Add 12 to t1 
Add t3 io t! 
Add t4 to H 
Add 15 to £1 
Add t6 to t1 
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Convert sum from char to int 


ҚЫ NAR, MEE C NA PARK dn COSE X its е! НУ), 


263 跳 转 指令 和 它们 的 编码 
在 正常 执行 的 情况 尺 ， 指 令 按 照 它们 出 现 的 顺序 一 条 一 条 地 执行 。 跌 转 (jump) 指令 会 导致 执 
行 切换 到 程序 中 一 -个 全 新 的 位 置 (参见 图 3.11)。 这 些 跳 转 的 日 的 地 通常 用 一 个 标号 (label) 指明 。 


Set Фепкіс0 
Goto .LI 


Null pointer dereference 


"ISF^OF)& ZF 
"(SF^OF] 
СЕЗСЕ 

1SFe“OF) | ZF 





图 3.11 jump 指令 


KT (EM 9» 
ХЕЗУ ОВАР) 
小 于 有 符号 < 
小 于 或 等 于 【有 和 衬 吾 <= ) 
超过 【无 符号 >》 
超过 或 相等 【上 符号 >= 
EF CERE 
КЕ (Е) 


“АЙЫН ЕНӘ ЛЕ. MERGEM И--ЖЕ ЕНШ. НЕШ ОН "EXA' {ЮКЕ AS XR ZR. 
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指令 jmp.L1 会 导致 程序 跳 过 mov] 指令 ， 从 pop НЕ ik iy, «ЕРГЕ НАМЫСЫМ, 
汇编 器 会 确定 所有 市 标 号 指令 的 地 址 ， 并 使 跳 转 目标 〔〈 目 的 指令 的 地 址 ) 编码 为 跳 转 指令 的 一 部 分 。 

imp 指令 是 克 条 件 跳 转 。 它 可 以 是 直接 跳 转 ， 即 路 转 日 标 是 作为 指令 的 一 部 分 编码 的 ， 世 可 以 
尽 间 把 跳 转 ， 即 跳 转 日 标 是 从 寄 和 仔 器 或 仓储 器 位 置 中 读 出 的 。 汇 编 语 羡 中 ， 自 接 陛 转 是 纵 出 一 个 标 
HFAB HAAI. Wii Lm Semis S "ILI", 间接 跳 转 的 写法 是 “*” 后 血 跟 一 个 操作 数 指 
ATE. ВХ У movl 指令 使 用 的 一 样 。 看 看 这 个 例子 ， 指 令 

Јар *%еах 
用 寄存 器 %eax rH Н FE ЖӘНе Fas. ІШІ 5 


jmp *{%еах) 


以 %eax 中 的 值 作为 读 地 址 ， 从 存储 器 中 读 出 跳 转 日 标 。 

匡 他 的 踏 转 指令 是 根据 条 件 玛 的 某 个 组 侣 ， 或 者 卡 转 ， 或 者 继续 执行 代码 序列 路 条 指令 ， 
请 注意 这 些 指 令 的 名 字 和 跳 转 条 件 与 set 指令 是 相 此 配 的 。 同 se 指令 Y. : 些 屿 层 的 机 器 指令 有 
EDAT. ЖИЕ RALARI. 

RARITA bH БЕЛМИ ТАШ, {НДЕ Bit IB ЕП ЛЕШ (PT C x; Ж 7 章 中 研究 
Пен EE. КОЛ, ДЕНЕМ ЕНІН, т ЕНИ. ТЕЙ ЖАШ. БЕНЕН 
fre 55). Likio UARRA жЕ ЕМЕ Н НЕ 3398485. МЕШ УЕЛ, A 
ШЖ ИШ, (HER HERE PC 相关 的 《PC-relative，PC = Program Countery。 也 就 是 ， 它 们 会 将 
虽 标 指令 的 地 址 与 紧 跟 在 跑 转 指令 后 徊 那 条 指令 的 地 址 之 间 的 莽 作 为 编 妈 。 这 些 地 址 备 移 量 可 以 编 
ША. -gETES. AIREA AE Н ЧАН” h, BTEUBRBEdEHm. 75898 
PGE AS LX ЕЕ Estee H КӨЗ. 

作为 一 个 本 РС ЯНА АРАУ Т, МН ЧАН Е Sa BE silly.e 文件 所 上 产生 的 。 它 
B ЛИН: 第 ] 行 的 让 指令 前 问 跳 转 到 更 禹 的 地 址 , 而 第 8 行 的 人 所 指 今后 向 跳 转 到 较 低 的 地 址 。 

] jle .L4 if <=, goto desi2 

.p2align 4,,7 Aligns next instruction to multiple of 8 
‚15: dest1: 

movi %wedx,%eax 

Sarl 51,*eax 

subl $eax, $edx 

test] €tedx,t*edx 


8 jg .L5 If >, goto dest1 
9 „Lå: dest2: 
16 Оу €$edx,*eax 


-1 ch іл oum Аш БӘ 


注意 ， 第 2 HE -条 针对 汇编 器 的 命令 〈directive)， 它 会 使 后 面 指令 的 地 址 从 16 的 倍数 处 开 
As 而 最 雪 浪 费 7 了 个 学 节 。 这 条 命令 是 为 使 处 理 器 能 更 优化 地 使 用 指令 高 速 缓 存 存 储 器 {instmetion 
cache memory ). 


(ӛн ЕҢ) “о” RARI CL 编 版 本 是 这 样 的 ， 


1 8: 7e 11 jle lb <silly+0x р> Target = dest2 


ғы 


2 а: 3d bé 00 00 00 06 lea 0х0 {%е51}, %езі Added пор 


程序 的 机 路 级 表示 129 


3 10: 89 dô mov *$edx,€*eax dest]: 

4 12: cl £8 01 sar SO0xl,€*eax 

5 15: 23 c2 sub Жеах,%ейх 

5 17: 85 а2 test $edx,tedx 

7 19; 7f E5 jg 10 «sillysOxi0- Target = desli 
8 1b: 89 40 mov edx, becx desi2: 


$211 1ea0x0[tesi), Феві BARAIA ERAR ЫЛЕ АӨ ЧЕЛИН C пор), 
使 得 下 一 条 指令 (第 3 行 ) 的 起 始 地 址 是 1609436. 

AX s ED EREET, Të 1 的 跳 转 日 标明 确 指 明 为 0x1lb， 指 令 7 的 是 0x10。 不 过 , XX 
性 指令 的 学 节 编 码 ， 会 看 到 跳 转 指令 1 的 口 标 编码 {在 第 二 个 字 节 中 ) 为 Gx11 CT Ed UD. PE 
ME Oxa C [HP 10;， 也 就 是 下 一 条 指令 的 地 址 ， 就 得 到 距 转 口 标 地 址 Ox lb. СУЕ) 270), 
j^ 8 的 地 址 。 

ЗДЫ, ВТ Т 的 日 标 用 单 守 季 、 二 进 制 补 码 表 示 编 码 为 0xf5 【十进制 -11)。 将 这 个 数 加 
上 0xib 《十进制 27)， 即 指令 8 的 地 址 ， 我 们 得 到 0x10 СТУ 16), EHE S 3 的 地 址 ， 

正 训 这 些 司 于 说 明 的 哮 样 ， 当 执行 与 PC 相关 的 寻 址 时 ， 程 序 计 数 器 的 值 是 跳 转 指令 后 面 的 那 
条 指令 的 地 址 ， 而 不 是 岁 转 指令 本 身 的 地 址 ， 这 种 惯例 可 以 追 述 到 早期 的 实现 ， 当 时 ， 处 理 器 会 将 
更 新 程序 计数 器 作为 执行 一 条 指令 的 第 一 水。 


КЕЛЕТ Б TIR А. 

1 8С483с8: Те 11 jle 30483db «sillys-Ox1lb» 
2 st483ca: На be 00 00 20 00 Іва 9х01%езі),Фені 

3 80483320: 89 40 mov фсіх,Феах 

4 8048332: cl fB 01 Бат s0x1,3eax 

5 BC(d8335: 29 c2 sub eax, $edx 

6 8С48347: 95 d2 test tedx,%edx 

7 5048349: VË £5 14 8048330 <5111у+0х10> 
8 BU4áBidb: 89 40 mov ћедх, %еах 


这 些 指令 被 重 定位 到 不 同 的 地 址 ， 但 十 弟 1 行 和 第 ? 行 中 跳 转 目标 的 编码 并 没有 变 。 通 过 使 用 
了 PC 相关 的 跳 转 唱 标 编码 ， 指 令 编码 很 简洁 〈 只 需要 两 个 字 节 )， 而 且 目 标 代码 可 以 不 做 改变 就 移 
ЕЕ AS ISI (Rs 
练习 题 3.8 
在 下 面 这 些 反 汇编 二 进 制 代码 节选 中 ， 有 些 迟 总 被 义 民 蔡 了 ， 回 答 下 列 关 于 这 些 指令 的 问题 ; 
A. 下面 jbe 指令 的 目标 是 什么 ? 
aüdá4Bdlc: 78 da Jke ANA NN X 
Б048415: eb 24 1р 8048044 
B. mov 48 09 A, Ж S y? 
AXEXXXXX: ер 54 jmp 5048444 
ХАХАХАХ: c7 45 ЕБ 10 00 mov SO0xl1D0,0xEfffffffB(&ebp) 


C. ЕЕ EP, SR E 45695822: РСЖ, BE АЖА SEEK, EYE 
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Ж А, KA h) K ya. ARR PI, БЕ IA32 的 小 端 法 字 节 顺序 ， 跳 夸 目 标的 地 址 是 什么 ? 
HD4B902: ey cb 90 OD 00 jmp XXXXXXX 
848390): 80 nor 
D. 请 解释 右边 的 注释 与 左边 的 字 节 代码 之 间 的 关系 。 这 两 行 都 是 mp 指令 编码 的 一 部 分 ， 
1048350: ff 25 ей a2 04 imp “П0хЕПАа2е0 
йан о: 09 
ATEC 6423455 4. АЛЕ Ж ARTANA 36 2 p Ж М siti. ВЛ Я, 
TAXCÉ 6435, MEM ЕНӘ ЕЕ, ЖАЗАЙЫН. 


364 翻译 条 件 分 支 

C 中 的 条 忻 语 凶 是 用 有 条 件 和 无 条 件 跳 转 结 台 起 来 实现 的 . 例 妇 ,图 3.12 给 出 了 一 个 计算 两 数 之 

ARAE HICAT (а). (с) 是 GCC 产生 的 汇编 代码 ， 我 们 创建 了 对 应 的 C 版 本 ， 称 为 gotodiff 
Сы», “ЕЕЕ ДАН 编 代码 的 控制 流 。tb) 使 用 JC 中 的 goto 语 句 ， 这 个 语 铝 类似 于 汇编 代 
凤 中 的 和 条 件 卡 转 ， 第 6 行 的 goto Тезере ТӘН, ОНАЈ БОНУ е, BOT 
第 7 行 上 的 语句 。 请 注意 ， 通 常 认为 使 用 goto 语 句 是 .种 不 好 的 编程 风格 ， 因 为 它 会 使 代码 难以 阅读 
和 调试 。 在 我 们 胸 斤 述 中 使 用 goto 语 可， 是 为 了 构造 描述 汇编 代 公 程序 控制 流 的 C 程 序 。 我 们 称 这 样 
МСН “роо Д4”. 

НЕН АКЕ ТИЕ (第 3 行 )， Ша ЖИН. ШЕШИНЕ ЖЖ x jT y. Ж 
ЖЕЛЕ EVER у-х ҚЫ CS 9170, 否则 就 继续 执行 计算 x-y 的 代码 (第 5 行 和 第 6 行 )。 
在 这 肯 种 情况 中 ， 计 算 结 果 都 在 放 在 寄存 器 %eax 中 ， 到 第 10 ЕЖ, ЖЕ. ЕЛІН ЗО МІЗ 

CHA LR HOO. 

C 中 的 if-else т) ЕН JEA Ж ОТ: 

if  (fest-expr) 
then-statement 


else 
else-statement 


这 里 test-expr 是 一 个 整数 表达 式 ， 它 的 取 值 为 G (ӨҢД “ЕУ 或 者 为 非 0 (解释 为 “ 真 站。 
Aea tiep Chen-statement 和 else-statement》 只 会 执行 一 个 。 
对 于 这 种 通用 形式 ， 汇 编 实现 通常 会 使 用 下 面 这 种 形式 ， 这 里 ， 我 们 用 C 语法 来 描述 控制 流 ， 
L = test-expr: 
Е (L) 
qoto true; 
else-Matement 
qoto done; 
true; 
then-statement 
done: 


U y 6, 汇编 器 ^J then-statement ЖІ else-statement РУ А IER, 并 捅 入 条 件 和 ER Xu 
X DRAEBESAT ЕНЕ, 
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code/asm/abs.c 
] int cotodifflint x, int y) 
a [Í 
3 inL туа1; 
4 
5 17 (x < y] 
— — code/asm/abs.e 6 goto less; 
1 int absdiff(int x, int y) 7 rval = x - y; 
2 1 8 qoto done; 
3 іі (X < ү) 9 less: 
4 гегогп y - X; 10 rval = y - x; 
2 else 11 done: 
б reiurn x ` y; 12 return rval; 
е 13 ) 
code/asm/abs.c code/asm/abs.e 
(а) Ig aic f (b) ty 2 etf if gotohi А. 
1 movl 8i*ebp),£€edx Gel x 
à movil lZi$ebp),£€eax Gel y 
3 cmpl $eax, tedx Compare x:y 
4 jl .L3 lf <, goto less 
D Subl %еах,%еах Compute x-y 
& movl %ейх,%сах бе? as return value 
7 jmp .L5 Goto done 
8 ‚13: less: 
3 subl Фейх, %еах Compute y-x as return value 
10  .L5: . done: Begin completion code 
(c) ЧИ CBS 


4312 条 件 语句 的 编译 
C 过 程 absdiff (а) EX — F if-else iE), PERLA Сс), m C 过程 gotadiff (b) ШТІ ЛЫМЕН. ЕЖ: 


iL PUR ІНЕ vo RETE RES HERES 


练习 题 3.9 
当 给 出 下 列 蕊 代码 时 


1 void condiint a, int *p) 
2 { 

3 if [p && à > 0) 

4 *р += а; 

5 ] 


GCC 会 产生 下 面 的 汇编 代码 ; 


coderasm/simple-1f.c 


code/asm/çvimpie-if.c 


132 %3% 


1 тоу1 5 (жерр\, едх 
2 movl 12 (%ерр}, %eax 
3 testl €eax,teax 

4 je . L3 

2 test] %еЛх,%ейх 

b jle .53 

f addl %ейх,{%еах) 

s bài 


А. А 3.12 (b) "P PER АЖ. M C — 4 goto 版 本 ， 搞 行 同样 的 计算 ， 并 模拟 汇 编 代 码 
的 控制 流 。 昼 我 们 在 示例 中 那样 给 汇编 代码 加 上 注解 可 能 会 有 帮助 ， 
BB， 请 说 明 为 什么 忆 伐 码 中 只 有 一 个 让 语 自 ， 而 汇 篇 代码 包含 两 个 条 件 分 或 ， 


3.6.5 ”循环 
СЕЙТЕН, ED while. for 和 do-while. 汇编 中 没有 相应 的 指令 在 在 。 作 为 蔡 代 ， 
将 条 御 测 试 和 跳 转 组 合 起 来 实现 竹下 的 效果 。 有 趣 的 是 ， 入 多 数 汇 编 器 根据 个 循环 的 do-while Ж 
ART ИМАШ. 即使 在 实际 程序 中 , 这 种 形式 用 的 相对 较 少 。 其 他 的 循环 会 首先 转换 成 do-while 
зч, НЛА ЗО, А АРЗОН А ПА ЗНУ. А, do-while Н. AA f PHASE 
复 江 的 实现 。 
do 一 while ЎН 
do-while 语句 的 通用 形式 是 这 样 的 ; 
до 
bodv-statement 
while (test-expry 


ЙИН LB ИЗАТ body-statement. XJ test-expr ЖҮН, WERGEA ATE, aba EUR 
LB. PEE. body-statement 至 少 执行 -次 。 
通明，do-while 的 实现 有 小 面 这 样 的 通用 形式 
loop: 
body-stawment 
t = lest-expr, 
if (t) 


goto loop; 


作为 一 个 示例 , E313 给 出 了 一 个 用 do-while 循环 计算 Fibonacci 序列 中 第 n TA ЕСИ. 
Fibonacci 序列 是 这 样 递 由 定义 的 ; 


“т; 
1 


l 
F, = 1 
F. = Р жЕ, п>] 
比如 说， 该 序列 的 前 10 2 Е 1. 1. 2. 3. 5, 8. 13. 21. 344153. НІ do-while 循环 来 实 
ШІ, FAEM Р = 0 和 F,= 1 Ж, 而 不 是 从 局 和 所 开始 的 。 


] int fib, dwlint n) 
2 d 
3 int 1 = 0; 
4 int val = 0; 
5 int nval - 1; 
6 
I do í 
Б irt t 
ü val = nval; 
10 nval = t; 
il ++; 
2 ) while (i < п}; 
13 
14 return val; 
15 1 


жә [m Dm 


9 


HB RAS PHA 7 





со 1 «л л ds w Мо ке 


i UE Bd 5 


= val + nval; 


(a) C A 


.L5: loop: 


leal (*edx,$ebx),* 
movl Фейх, зербх 
movi &eax,£edx 
incl $ecx 

cmpl £esi,€ecx 

^l .L6 

mov] £€ebx,$eax 


CEK 


(b) ЛЕМ iB ENE 
& 3.13 Fibonacci ғ do-while 版 本 的 C XI da (60 
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code/asnvfib.c 


cade/asm/fib.c 


Compuie t = val + пуаі 
сору nval to val 

Copy t 10 пуа! 
increment i 

Compare {п 

If less, goto loop 

Seit val as return value 


ШК Т ЖЛ ЛА ДЫЙ ҚЫН, ШЖ - 张 列 出 寄存 器 和 程序 值 之 间 对 应 甘 系 的 表 。 和 在 
这 个 例 了 中 ，body-statement 是 第 8--1114Т, Xd t, val 和 nval 赋值 ， 并 将 1 加 1。 这 些 功能 是 出 汇编 
代码 的 第 2 一 5 ITERE. KEA i < n 就 是 test-expr。 第 65 行 和 第 7 行 的 跳 转 指 令 的 测试 条 件 实现 


了 这 个 表达 式 ，。 


-EARR ЖЖ val 接 进 寄存 器 品 eax， 作 为 返回 慎 CEST). 


创建 -个 像 图 3.13 Cb) 中 那样 的 寄存 器 使 用 表 ， 对 于 分 析 汇 编 语言 程序 是 很 有 帮助 的 ， 特 别 


E DH ERWIN. 


1& 5] 3.10 
HT CAS 


. int dw loopíint x, int y, 


2 i 


int n; 
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~] c^ (п Ым ы 
һа 
ж 
I 
їй 


| while ((n > 0) & (y < n)); /* Note use of bitwise '&' */ 
return x; 


) 
GCC P £ f Teu HEC AS. 


Initially x, y, and n are at offsets 8, 12, and 16 from $ebo 


ID Ly 


1 movl 8{%ерр),%ев1 

2 movl 224%сЫр), Sebx 

3 movl 6 {Ф%ерр) , %есх 

Д .рга1 ап 4, ,7 inserted Lo optimize cache performance 
5 16; 

b imull ссх, %ерҳ 

É addi %епх,%ез1 

5, deci Фесх 

9 testl Жесх,Фесх 


10 setg $al 
11 cmpl Фес, $ebx 
ЦУ, setl %а1 
23 andl Жейх,%сах 
74 tostb 51,%а1 
.5 jne .іё 
А. 创建 一 个 等 存 器 使 用 表 ， Жы 313 (b) 中 所 示 的 那个 。 
B. 指出 己 代 码 中 的 test-expr 和 body-statement， 以 及 汇编 代码 中 相应 的 行 ， 
C. 对 汇编 代码 添加 一 些 注 释 ， 描 述 程 序 的 操作 ， 类 似 于 图 3.13 (bh】 中 所 示 的 那样 ， 
while Ж 
while Ит) ii H] Жтт 3S xx RES. 
while (test-expr) 
body-statement 


Е 9 do-while 的 林 同 之 处 在 于 对 test-expr 求 值 ， 在 第 一 次 执行 body-statement 07. Әйіп 
ETE ШЖ ТЕН goto 语 钧 的 形式 就 是 
loop: 
t = lest-expr; 
it (1%) 
goto done; 
body-statement 
goto аоор; 
done: 


这 可 条 兰 要 求 内 循环 ， 也 就 是 执行 次 数 最 多 的 代码 部 分 ， 里 有 两 条 控制 语句 。 相 反 ， 大 多 数 C 


程序 的 机 器 级 表示 {35 


йч ЕЛА БЕТА ЕК do-while ТАУ, Д-Т ЕЖ ЖЕНЕН ИЖ И TOC : 
if (!test-expr) 
goto done; 
do 
body-statement 
while (üfest-expr]: 
done: 
然后 ， 这 段 代码 可 以 转换 成 带 goto 语句 的 代码 ， 
L = fest-expr; 
if ilt) 
geto done; 
оор: 
body-statement 
т = f[est-expr; 
iE it} 
qcto loop; 
dong; 


作为 一 个 例子 ， 图 3.14 给 出 了 一 个 用 while 循环 来 实现 Fibonacci ЛЯ РА СУЗ Са). ЕҢ, 
АК BOTE TE НМ лж Емар! пуа) ЖИЕ С РА fib. сою (b) 表明 了 这 段 代码 是 如 
T ЕНГ IE. ІП Сс) 中 的 汇编 代码 非常 接近 于 fib_w_goto 中 的 С PES. ЖАНТ TUE 
AARRE. AELE goto 799 (b) ЖА]. Ел, ЖЕТЕЛІ ЕН i 作为 循 二 变量 并 且 在 
每 次 重复 时 全 它 子 于 做 比较 ， 而 是 引入 了 一 个 新 的 称 为 “nmi” 的 御 环 变量 ， 与 原来 的 代码 相 比 ， 
CREST n-i 这 使 得 编 详 器 只 用 一 个 寄存 器 作为 循环 变量 ， 而 不 用 四 个 ， 其 次 ， 它 将 最 原始 
BST Gen) 优化 成 了 《val < n)， 因 为 i 和 val 的 初始 值 都 是 1。 这 样 一 来 ， 编 详 峰 就 能 完全 
НЕЗЕІ 广 。 强 详 电 弟 常 利 用 变量 的 初始 值 来 优化 初始 的 测试 ， 不 过 这 使 得 解读 汇编 代码 有 点 腾 
和 类。 第 二 ， 为 了 循环 的 连续 执行 ， 要 保证 i <n， 这 样 编译 器 就 能 假设 nmi 是 非 负 的 了 。 因 此 ， 它 就 
ВЕЖ nmi ! = 0 TI^ i nmi >= 0 作为 答 环 条 件 来 测试 了 。 这 样 就 在 汇编 代码 中 省 略 了 CAIRO. 


练习 显 3.11 
оран CAE: 


int loop while(int а, int b) 
{ 
-nt 1 = 0: 
-nt result = a; 
whnile ii < 258) Í 
result += a; 
а -= b; 
1 += b; 
] 
р return result; 


=e м -1і ы ІП ыны n М к= 
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GCC 产生 这 样 的 汇编 代码 ; 


Initialiv a and b are at offsets 8 and 12 from ФеБр 
тау] H8itebp),S$*eax 
movl 121*ebp),tebx 
хог %®есх,%есх 
rovl Жаах,Жейх 
.p2align 4,,7 

. L5: 
addl łteax, ѕейх 
subl %ebx,%eax 
addl %ерх,%есх 
cmpl $255, %есх 

11 jle .L5 


A. П MS K 1 S A S de M K, ЖАТЫ 3.14 (с) 中 所 示 的 那 一 个， 

B. 指出 САФ test-expr 和 body-statement, КАЖ r IP ЛЕУ ЯТ. C 编译 器 对 初始 测 
斌 进行 了 什么 优化 ? 

С. 对 汇编 代码 添加 一 些 注释 ， 描 述 程序 的 操作 ， 类 已 于 图 3.14 (c) 中 所 示 的 那样 。 

D，( 用 已 语 言 ) 写 一 个 该 函数 的 сою АЖ, 它 的 结构 类 似 于 江 编 代码 的 结构 ,就 像 图 3.14 (b) 
中 所 收 的 那样 ， 


ыз со <<] cw ün ны GJ b — 


= 
27 





—— —— qeode/astmvfib.c 

1 int fib w_goto(int n) 
z 1 
3 int val = 1; 

—easm/fib.e 1 int nval = 1; 

1 int fib w(int n) 2 кпе пті, i 

2 ` 7 if (val >= n) 

3 int 1 = 1; 8 goto done; 

4 int val = 1; 9 nmi = n-1; 

5 int nval - 1; 1D 

6 11 loop: 

1 while ії < n) í 12 t = val+nval; 

8 int t = vai-«nval: 13 val = пуа1; 

9 val = nval; 14 nval - t; 

10 nval = t; 15 nmi--; 

-1 ira; 15 if (nmi) 

$ | 17 goto loop; 
18 

-3 13 done: 

-4 return val; 20 return val; 

15 } 212 

——üeasmhb.c -—— n code/asnvfib.c 


(a) C Ë 69 (b) 号 之 等 价 的 goto 版 本 





图 3.14 
ЖИЫН Г ERE QUERI ЗИТ nmi HERRERA ИН. 


for H. 


шы “а —— Ch ам e jJ D ҥе 


for 箱 环 将 时 用 形式 后 这样 的 


for (inir-axpr; test-expr; update-expr) 


body-statement 


Де Т 


movl 
movl 
movl 
cmpl 
1ge 
leal 
„Liĝ: 
leal 
тау 1 
movl 
decl 
jnz 
L8: 


віжеор),Феах Get n 
51, ерх Set vai to l 
5], Фесх бек nval to 1 
#рах,%єһрх Compare val:n 
‚19 If >= goto done 
-1{%еах),%еах nmi = п-1 
loop: 
(&ecx,tebx)],*eax Compute t = nval-«val 
Зесх, Ферх Set val to пуа] 
зеах, becx Set пуаі to Ё 
$edx Decrement nmi 
‚110 if іс 0, goto loop 
done ғ: 


(с) 对 应 的 并 RS S SES 


Fibonacci 的 while aae C 和 汇编 代码 


Сак АН, DU — DREAMS PERRA while HARRERA TE: 


"mnit-expr, 

while (ifestexpr) i 
body-statement 
update-expr; 

} 
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也 束 是 ， 程 序 首 先 会 对 初始 表达 式 initexpr 求 值 。 然 后 进入 循环 ， 它 会 先 对 测试 条 件 test-expr 
KE И RA EROR 假 "就 会 退出 ,然后 执行 循环 体 body-statement 最 后 对 更 新 表达 式 update-expr 


求 值 。 


这 段 代 码 编 详 后 的 形式 是 基于 前 和 面 讲 过 的 从 while 到 do-while МЕН, BÆ% HE do-while Ж 


AX 


irtit-expr; 

lf (test-expr) 
goto done; 

do | 
body-statement 
apdate-expr; 


) while (test-expr) ; 


done; 
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Жан, MEE SERE, goto 118: 


Inij-expr; 
t = test-expr; 
if (10) 

goto done; 

loop: 

body-statement 
update-expr; 
Ë = fest-expr; 


if {Е} 
goto lcop; 
done: 
作为 - ЛӨ. ШАБ Щ D PERI for ЕИ У Fibonacci d CI] Әр; 
——  F-— —— — — —— vode/asnvfib.c 
1 int fib ftnt n) 
2 { 
3 int 1; 
4 int val = i; 
5 int nval - 1; 
6 
7 for [i ті; 1 < rj i++) Í 
8 int t = val+nval; 
9 val = nval; 
19 ауа! = t; 
11 | 
12 
13 return val; 
14 ] 
一 一 一 一 - сойғ/авт/лв,с 


将 这 段 代码 转换 成 while 循环 形式 得 到 的 代码 与 图 3,14 АНЯ fib_w 的 代码 一 样 。 实 际 
E, GCC HATAR "b C FOE — EP. 
练习 题 3.12 
考虑 下 面 的 汇编 代码 
Inttially x, y, and n are offsets 8, 12, and 16 from %ebp 


mcvl ebx, ecx 
imull l2i%ebp),kecx 


1 movl 8(%ebp),%ebx 
2 movl 16 {ерр), едх 
3 ХОК} Ceax, вах 

4 decl Фейх 

5 j= .L4 

5 

T 


TELA S p SS р + 139 


8 p2aliga 4,,7 Inserted to optimize cache performance 
3 . L5; 

10 addl %есх,%еах 

11 subl £sbx,€*edx 

12 jns .L& 

13 .Là4: 


г 654 85 ХФ T 9 A CA ES. 
int loopíint x, int y, int n) 
í 
int result = б; 
int 1; 





result += 





) 


1 

2 

3 

4 

5 Tor {1 = ; 1 i= ) ( 
5 

р 

3 return result: 

9 


) 


ЕЛЕ C Nabi h М, ЖЖ ХОР $ ЖИЛ д M—F, dE 
结果 是 放 在 寄存 器 名 eax 中 返回 的 ,为 了 解决 这 个 问题 ， 你 可 能 需要 对 寄存 器 的 使 用 进行 一 点 猜测 ， 
HREBREGEmasSm53. 

А, ЖАМ result $e 1 应 该 放 在 哪些 寄存 器 中 ? 

B.i (354A X $ y? 

C. i 的 测试 条 件 是 什么 ? 

D. 是 如 何 更 新 i 的 ? 

E. 描述 如 何在 往 环 体内 增加 result 的 CC 表达 式 ， 不 会 在 一 次 循环 到 下 一 次 循环 之 间 收 杰 其 值 ， 
编译 器 发 现 了 这 个 情况 ， 将 它 的 计算 称 到 了 循序 之 前 。 这 个 表达 臣 是 什么 ? 

F. 填写 出 它 代码 缺失 的 部 分 . 


3.6.6 switch ЗЕ) 

switch. GTK) 语句 提供 了 根据 一 个 整数 索引 值 进行 多 重 分 支 multiway branching) 的 能 力 。 
住处 理 具有 多 种 可 能 结 朵 的 测试 时 ， 这 种 语句 特别 有 用 。 它 们 不 仅 提 高 了 C 代码 的 可 读 性 ， 而 且 通 
过 使 用 ЖАЗАҒА (jump table) 的 数据 结构 使 得 实现 更 加 高 效 。 跳 转 表 是 一 个 数组 ， 老 项 i 是 
一 个 代码 段 的 地 址 ， 这 个 代码 颖 实现 的 是 当 开 关 索 引 值 等 于 ;时 程序 应 该 采取 的 动作 。 穆 序 代 码 用 
并 关 索 引 值 来 执行 一 个 跳 转 表 内 的 数组 引用 ， 确 定 跳 转 指令 的 目标 。 好 使 用 一 组 很 长 的 让 else 语句 
相 比 ， 使 用 跳 转 表 的 优点 是 搜 行 开关 语句 的 时 间 与 开关 情况 switch cases) ИЖЕ Е, ССС 根据 
开关 情 襄 的 数量 和 开关 情况 值 的 稀少 程度 〈sparsity 》 KAMERZE., ЧЛЕН E CN 
如 ， 四 个 或 更 多 》， 并 且 值 的 范围 跨度 比较 小 时 ， 就 会 使 用 跳 转 表 ， 

ЕН 3.15 (а) 给 出 了 一 个 Cswitch 语句 的 示例 。 这 个 例 疗 有些 非常 有 意思 的 特征 ， 和 包括 情况 标 
= (case labels) 是 不 连续 的 【对 于 情况 101 和 105 是 没有 标号 的 )， 有 些 情况 有 多 个 标号 【情况 
104 和 106》， 而 有 些 情况 则 会 落 入 其 他 情况 (情操 102?， 因 为 对 应 该 情况 的 代码 段 没有 以 break 
ЖЕЕ. 
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———————— — — — — rüodt/asnykwitch.c 


] int swizch egíint x] 

2 Í 

i int result = x; 

< 

5 Switch ix) | 

6 

? сазе 100: 

8 result *= 13; 
9 break; 

19 

11 case 102: 

12 result += 10; 
13 /% Fall through */ 
14 

15 case 103: 

16 result += 11; 
17 2reak; 

18 

_9 case 104: 

20 саве 106; 

21 resulL *- resuit; 
22 break; 

23 

24 default: 

35 resul- = 0; 
26 } 

2T 

28 return result; 

29 ] 


code/asm/switch.c 


(a) switch ЕЙ, 
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code/asm/switch.c 


/* Next line is not legal C */ 


code *jtÍ[7] = { 
loc A, loc def, loc B, loc -, 
loc D, ioc def, ioc D 

Р 


int switch eg implíint x) 
i 
nsigned хі = x ~ 100; 
int result = x; 


if ixi > B) 
goto loc def; 


/* Next goto is not legal C */ 
goto Jt[xi]; 


loc А: f* Case 100 */ 
result *- 13; 
goto done; 


loc, B: /* Case 102 */ 
result += 10; 
{* Fall through */ 


loc C: /* Case 103 */ 
result += 11; 
собо done; 


loc В: Ж Cases |04, 106 */ 
result *- result; 
goto done: 


loc def: /f* Default case */ 
result = 0; 


done: 
return result; 


code/asm/switch.c 
C) ЖЗ ECHR 


3.15. switcn 语 铝 示例 以 及 到 扩展 CHRE 
919 EC Cexiended С) ИНЕК ГЕНЕ Je jc МН, UL MURU Ji BJ. З C PA 4 ЖИПЕК ЧЕЛИ ЇНЇ ЇЗ 
El 3.16 ЖӚН switch, eg РЕ ЕЙ A (UB ВОНИ C ИНГ 6 ЖАД de Н 3.15 
(b) 中 的 过 程 switch_eg_impl。 我 们 说 “扩展 的 ”是 因为 如 本 身 并 不 提供 支持 这 种 跳 转 表 所 顺 的 结 
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Bj, PPR] t E E НС. ЖШ р ЕК ТЕШ, ФРОММ, ЖИЕ, 
RETTET C. ЖЛ Т ЖЕЕ code. 


£t BM) p 


со =] cm D 


20 


Set up the jump table access 
lea. -100(tedx),*eax 
cmpl S6,€eax 

ja .L9 

jmp %,.1101,%еах,4) 


Case I00 


.Lá: 


leal {%едх, едх, 2), гах 
lea] [t*edx,€eax,4],*edx 
jmp .L3 


Case 102 


L5: 


addl 510, едх 


Case 103 


Lb: 


addl $11,&edx 
тар .L3 


Cases 104, 106 


‚18: 


imull Фейх, едх 
jmp .L3 


Default case 


L3; 


xorl $edx,S€edx 


Return result 


Uis 


movl *edx,£eax 


Compute xi = x- 00 
Compare xi: ó 

if >, gotoloc def 
Goto jtIxi] 


loc. А: 
Compute 3*x 
Compute x-4*3*x 
Coto done 


loc Б: 


result += 10, Fall through 


ос C: 
result += 1I 
Goto dene 


loc D: 
кезі *— resuit 
Goto done 


loc def: 


result = 0 


done: 
Set result as return value 


4 316 E 3.15 m switch 语句 示例 的 汇编 代码 


第 1-411 we Т ЙЕ И АН. ATREA x 的 值 小 于 100 sk K+ 106 时 会 执行 default JF 
关 情 况 指 定 的 计算 ， 民 码 生 成 了 一 个 等 于 x-100 的 无 符号 值 xi. XE Tr T 100—106 之 间 的 x КИН, 
xi PEE 0—6 25], BRL x-100 的 贷 值 会 绕 回 成 非常 大 的 无 符号 数 。 因 此 ， 当 交大 于 6 上 时， 代码 
用 a CAS KT) di SORS ШАЛА ҒАНЫН. НИЖНЕЕ, Вт “个 跳 转 ， 
转移 到 表 中 表 硕 xi 处 的 地 址 。 注 意 ， 这 种 形式 的 goo PERAR OCEA. 189 4 实现 的 是 到 跳 转 
表 中 茶 个 表 项 的 转 称 。 内 为 是 间接 跳 转 ， 目 标 是 从 存储 器 中 读 出 的 。 读 的 有 效 地 址 是 由 标号 .LI10 指 
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是 的 基地 址 加 上 变量 xi СТЕ ЯТТ я cea T0 的 伸缩 值 《 伟 缩 因子 介 为 4， 因 为 跳 转 老 的 每 小 表 项 
ñm 4 TETO 确定 的 。 
在 汇编 代码 中 ， 跳 转 表 是 败 下 面 这 样 的 声明 表示 的 ， 我 们 添 扣 了 … 些 注释 : 


1 „section ,rodata 

2 .align 4 Align address to multiple of 3 
3 „110: 

4 long .L4 Case 100: loc А 

5 (Тола .1,9 Case 101: loc def 

Б .long .L5 Case 102; loc B 

7 „long .Tb Case 103: loc C 

Я .long .L8 Case 104: ioc. Р 

3 „long .19 Case 105: loc. def 

10 .long .L8 Case 106: ioc, D 


АЕН B НН, {ЕШ " rodata" (or "^ HE OB”, “Read-Only Data). 89 НЖ sr (E97 
т, МИН 7 T UAE" E (4 个 字 节 )， 每 个 字 的 值 都 是 与 指定 的 汇编 代码 标号 〈 例 如 ，.L4) 
HRH TIRAGE. 标号 10 标志 看 这 段 分 配 的 起 始 。 与 这 个 标号 相对 应 的 地 址 会 作为 问 接 跳 转 【〈 指 
令 4) 的 基地 址 。 

ft switch_eg_impl 中 (图 3.15 (by)， 从 标号 lnc А 开始 , 一 直到 loc_D 和 loc_def 的 代码 块 ， 
实现 了 switch 庄 句 的 五 个 涉 问 的 分 支 。 可 以 观察 到 ， 当 x 超出 100—106 范 习 时 【初始 范围 检查 )， 
或 者 当 它 等 于 101 或 105 时 《根据 跳 转 老 )， 都 会 执行 株 号 为 oc def (CREER. ЖЕЗ loc B 
网民 码 块 是 如 何 落 入 标号 为 ос С 的 代码 块 的 。 
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在 下 面 的 CC 函数 中 ， 我 们 当 略 了 switch 8 óJ 0 44k, A C Kb. FAAS (сазе labels ) 
是 不 连续 的 ， 而 有 些 情况 还 有 多 个 标号 ， 
int swiLch2iint x! | 
int result = 0; 
switch [x] : 
/* Body of switch statement omitted */ 


l 
return resu.t: 


E BEREIT. GOC 为 程序 的 初始 部 分 以 及 跳 转 表 生成 了 直面 这 样 的 汇编 代码 ,变量 x 开始 时 
是 位 于 相对 于 寄存 器 色 ebp i EA 8 的 地 方 ， 


Jump table for switch? 
1 „Lil: 
2 long .Ld 
Setting up Jump table access 3 long .L10 
1 movl sSi*ebpl),$eax Retrieve x 4 .long .L5 
2 addl $2,%еах 5 long .L6 
3 cmpl 56,%еах 5 .long .L8 
4 Ја .110 7 long .L8 
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= jmp 5.1111,%еах,4) 8 long .19 
根据 前 奋 的 信息 来 回答 下 到 问题， 

А. switch 语 各 体内 的 开关 情况 标号 的 值 是 多 少 ? 

B.C 代码 中 哪些 开关 情况 有 多 个 标 写 ? 
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“个 过 程 调用 包括 将 数据 【以 过 程 参数 和 返回 值 的 形式 ) 和 控制 外 代码 的 一 部 分 传递 到 另 一 部 
分 。 另 外 ,， 它 还 必须 在 进 入 时 为 过 程 的 局 部 变量 分 天 空间 ， 并 在 退出 时 释放 这 些 空间 。 大 多 数 机 器 ， 
包括 IA32， 只 提 失 简单 的 转移 控制 到 过 程 和 从 过 程 中 转移 出 控制 的 指令 。 数据 传递 、 局 部 变量 的 分 
FIERE ECCE DUET Б Ж ЗЕ НН. 


3.7.1 栈 帧 结构 

[A32 程序 用 程序 栈 来 支持 过 程 调 用 。 栈 用 来 传递 过 程 参数 、 存 储 返 回信 息 、 和 保生 寄存 器 以 供 以 
后 局 复 之 用 ， 以 及 用 于 本 地 存 情 。 为 单个 过 程 分 配 的 邯 部 分 线 称 为 栈 帧 〔【stack frame), |8 3.17 32 
了 和 屋 巾 的 通用 结构 。 栈 帧 的 最 质 果 是 以 遇 个 指针 定 界 的 ， 格 仓 器 和 ebp 作为 帧 指针 ， 而 寄存 器 各 esb 
作为 栈 指 针 。 当 程序 执行 时 ， 栈 指针 是 可 以 移动 和 的， 因此 大 多 数 信 息 的 访 辣 邦 是 相对 于 蛋 指 针 的 。 

ЕСЕР 调用 者 ) 调用 过 程 Q (RAAR). ORERE P ҢЫ, ЖУК, САРИН] Q 
ЕУ, P Ego hb ЖАН, E RP ВЕДИ ВЕ, ЗААН Е АЕ РЕДА ОЗАТА 
执行 的 地 方 。 昌 的 栈 巾 从 保存 的 帧 指针 的 值 ( 例 如 ，%ebp) Ж. ЛАА ЖЕЕ ВЕНН. 

过 程 怠 也 用 栈 采 保存 其 他 不 能 存放 在 客 存 器 中 的 局 部 变量 。 这 样 做 是 因为 

e 寄 伯 器 不 够 存放 所 有 为 局 部 变量 ， 

. ”有些 局 部 变量 是 数组 或 结构 ， 因 此 必须 通过 数 维 或 结构 引用 来 访问 。 

ө 要 对 一 个 局 部 变量 使 用 地 址 操作 符 “ 作 ”， 因 此 我 们 必须 能 驶 为 它 产生 一 个 地 址 。 
Ен, Q 会 用 栈 帧 来 存 节 它 调 用 其 他 过 程 的 参数 ， 

正如 表面 讲 过 的 那样 ， 找 向 低地 址 方 辣 增长 ， 而 栈 指针 名 esp 指向 栈 硕 元 素 。 可 以 通过 push) M 
рор! 指令 将 数据 存 入 栈 中 和 从 栈 中 取出 。 可 以 通过 将 栈 指 针 的 值 减 小 适当 的 值 来 分 配 没 有 指定 初始 
值 芍 数据 的 空间 。 类 世 地 ， 可 以 通过 增加 栈 指 针 来 释放 空间 。 


3.7.2 转移 控制 
下 表 给 出 的 是 支持 过 程 请 用 和 返回 的 指令 ， 


call Label 过 程 育 用 


са11 *Ореғапй | 过 程 谓 用 
leave КАЕ 
ret 从 过 程 调用 中 返回 





call 指令 有 一 个 日 标 ， 指 明 被 调用 过 程 起 始 的 指令 地 址 。 同 跳 转 - 样 ， 调 用 可 以 是 直接 的 ， 也 
可 以 是 间接 的 。 在 汇编 代码 中 ， 直 接 调用 的 日 标 是 -个 标号 , 而 间接 调用 前 日 标 是 * 后 面 跟 -~- 个 操作 
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数 指示 符 ， 其 语法 与 mol 指令 的 操作 数 的 语法 祖 阿 【图 3.3)。 
栈 底 





ЕҢ Вуд 
| 
no kr Ac 
+á- 4n 
| Ж A pom 
18 参数 | | 
+4 x [a] Hi hl- , 
МІН EA 
Фр 一 WE N Феір 
-4 
МЕТЕВ e E Ж. 
Ans ЕН! 
临时 变 基 当前 由 
一 
"besp 
tm 
图 3.17 s 


АЕ, ТЕБА ЕЕ А. ЖЕНЕ. ARATAT. 


call ИА ЛЕЕ Е НАНЕ А.Ж, JEPETE SIUS Е a Rb. JR ЫЛЕ ИЕР Т 
call 后 徊 的 那 条 指令 的 地 址 , ДАН РЕЗА ПЕЧ, га ЛАИКА, ге 指令 从 栈 中 弹出 地 址 ， 
ЖЕНА. НЕН EIE. ЕТЕНЕ, БИН ЕНІНЕН call TET AT ARI 
КЛЕРІМЕ. leave ЗЕ o AR RER RO REE Ы. EFF МЕНИ ЗУ) 

1 movi ФеРрр, Февр Set stack painter to beginning of frame 


2 pool &ebp Restore saved %ebp and set stack ptr 
to end of caller's frame 
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AM. APNE t L +E ПИА ECHETE FH] ЕЛНИ UL НИЕ К ЛОВ. 
A Ан Феах ПАН] ЖЖ ИА, E CE [Е RS EIS 


2 5] 3.14 
T d Kan B Bf AEREE d ЫНА ЖФ. 


1 call rext 

2 next: 

3 popl %Ж%еах 

А. ЖЖ B %eax К Ж x, 7 ААА? 

B. 解释 为 什么 这 个 调用 没有 匹配 的 rel 指令 。 
C. 这 段 代码 完成 了 什么 功能 ? 


3.7.8 寄存 促使 用 惯例 

程序 寄存 器 组 是 惟一 一 个 被 所 有 过 程 具 享 的 资源 ， 虽 然 在 给 下 时 刻 只 能 有 一 个 过 程 是 活动 的 ， 
我 们 必须 保证 涯 -个 了 过程 【调用 者 》 ЯНА САА) 时 ， 被 调用 者 不 会 覆盖 某 个 调用 者 稍 
后 会 合用 的 寄 在 器 的 值 。 为 此 ，IA32 来 用 了 一 组 统 -的 寄存 器 使 用 惯例 ， 所 有 的 过 程 都 必须 遵守 ， 
包括 程序 库 中 的 过 程 ， 

根据 惯例 ， 寄 存 器 %eax、%edx Ehee 被 划分 为 调用 者 保存 【caller save) 寄存 器 。 当 过 程 P 
МНО, 可 以 米 盖 这 些 寄 存 器 ， 而 不 会 破坏 任何 P 所 需要 的 数据 。 男 外 ， 寄 存 器 名 ebx 、%esi 
ей 被 划分 为 被 调用 者 保存 caliee sav) 寡 存 路 。 这 意味 着 Q 必须 在 覆盖 它们 之 前 ， 将 这 些 寄 
SE GE SET. EERE ЕИ, US P (或 某 个 更 高 层次 的 过 程 )》 可 能 会 在 今后 的 计 
算 中 尖 要 这 些 值 。 此 和 外， 根据 这 里 描述 的 惯例 ， 必 须 保持 寄存 器 %ebp Февр. 


$i: 为 什么 叫做 “被 调用 者 保存 ”和 “请 用 者 保存 ”? 

者 处 下 面 这 个 场景: 

int РІ) 

{ 
int x = Ғ();  /*Somecomputation */ 
90); 
return x; 

} 


过 程 了 希望 它 计算 出 来 的 x 的 值 在 调用 了 QUEDAR bX GEHE EAR 
中 ， 而 P GARA) 必须 在 调用 О АЕ а, ХЕ QUESUEMLUL. eX 不 在 一 个 被 调用 
者 保存 寄存 器 中 ，Q ( 被 调用 者 ) ЕЛАТА, ЖА Q 在 使 用 这 个 害 存 器 之 前 ， 必 须 保 让 这 


个 值 ， 芽 在 返回 前 恢复 它 ， 在 这 两 种 情况 中 ， 保 存 就 是 将 害 存 器 值 压 入 栈 中 ， 而 恢复 是 指 从 栈 中 豌 
出 到 寄存 器 中 ， š 


ЕЈ, ЯШ РЕХАН: 
1 int Bilnt x] 
2 í 


3 int y = x*x: 
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1 int z = Qiy}; 

5 

б reLurn y + š; 

7j 

过 程 了 在 调用 中 之 前 计算 у, НАЕ Е у IHE TE ОЗЫ [Н WERE BS. 有 两 种 方式 可 以 做 
SIC is 

° ¿n AW QW. Жу 的 值 存放 在 自己 的 栈 幢 中， 当日 返 加 时 ， 它 可 以 从 栈 中 取出 y 

[НИЕ 


+ EU] DUE y Boe Dr aB КЕНЕТ. ШЖ 外， 或 任何 其 他 OWARE. МИЎ 
НЕЕ, ELIA RAA ARERR., Е АРЛА ТВ CREAR. БИШЕ. ` 
Q 返回 到 P 了 时 , y 的 值 会 在 被 调用 者 保存 寄存 器 中 , "КА ДЕА Б {т КАНН, 或 
者 是 因为 它 被 保存 并 恢复 了 。 

最 常见 的 是 ，GCC 使 用 后 一 种 方法 ， 因 为 它 会 尽量 减少 写 和 读 栈 的 次 数 ， 


5 2] 3.15 

下 面 这 段 代码 出 现在 GCC 为 一 个 C SERE P> AE MEL B Қана W šE 
pushi tedi 

pushl Феѕі 

pushl ebx 

movl 24(*ebp),S$eax 
imull l6í($ebp),£€eax 
mov] 24 (Фарр),Ферх 
lea: 0{,%еах,4),%есх 
addl 8(іжерБр),%есх 
movl зербх,Жжейх 


i112 3), AME EA SASS (Фей. wesi Фе) ЖЖЯЗ|7 8 p. KERR ЕЖЕЛ, БА 
ЖУТЕ МА 8 ( Феах. Фесх je Фейх), ІЛЕ, B| pop! d 7M X. З SS са. wesi Яз ерх, 
m ДИННЕ SE Ж, 

WW ЖЕЕ T JEU REB AR APER. 
374 过 程 示 例 

作为 一 个 示例 , 考虑 图 3,18 中 定义 的 CC 过 程 ,图 3.19 给 出 了 这 两 个 过 程 的 栈 帧 ,注意 , swap, add 


从 caller 的 乒 帧 中 包 出 它 的 参数 ,这 些 参 数 的 位 置 的 访问 都 是 相对 十 寄存 器 各 ebp 中 的 帧 指针 的 。 帧 
正 边 的 数字 表 水 相对 于 帧 指针 的 地 址 偏 移 。 


5 


ы CO ©] Cc» {л ou e К 


code/asm/swapadd.c 
int swap add(int *xp, int *yp) 
{ 
int x = *xp: 
int y - *yp; 


шап oum de Мм ғә 


*Xp = y; 
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i *yD = X; 
5 return x + y; 
9 } 
10 
11 int са11ег{} 
12 í 
13 int arg] = 514; 
14 int атда = 1057; 
15 int sum = swap, addí(&argl, &arq2); 
]6 int diff = argl - arg2; 
17 
18 return sum * diff; 
19 | 
-- code/asm/swapadd.c 
图 3.18 ”过程 定义 和 调用 的 示例 
在 调用 
帧 指针 swap add 之 前 在 mwap add ik rh 
Фер — ( 
一 六 
-g caller 
fi Hel 


ӨНЕ 


жер ———»-—16 






由 指针 和 bp 一 一 0 


3.19 caller Жі swap ada жы 
БІН swap add M, caller FJ Ri P Ee H ЕНЕ. 


— ІНІМ 
HH teap 一 —* -4 


caller 的 栈 帧 包括 局 部 变量 argl 和 arg2 的 存储 ， 其 位 置 相对 于 帧 指针 是 -8 和 -4。 这 些 变量 必须 
存在 栈 中 ， 因 为 我 们 必须 为 它们 产生 地 址 。 接 来 的 这 段 来 自 caler 编 详 过 的 汇编 代码 显示 出 它 是 
3115] Ui] swap. add 的 


Calling cade in caller 


1 leal -4í&ebp),*eax Compute &ағр2 

2 pushl $eax Push &argZ 

3 leal -8(*ebp),$eax Compute dargi 

4 pushl Жеах Push &arg1 

5 call swap. add Call the swap. add function 


HE. ВАТИ ЕВ Ў Е arg? 和 ага! 的 地 址 (H leal 65), Mel Ah. Ж 
后 基 调用 swap. add. 


swap add 编 详 过 的 代码 有 三 个 部 分 :“ 建 立 ” 部分， 初始 化 栈 帧 :“ 主 体 ” 部 分 ， 执 行 过 程 的 实 
ИЯ: 和 结尾” 部分， 恢复 栈 的 状态 和 过 程 返回 ， 
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ТЖ swap add 的 建立 代码 。 品 想 一 卜 ，gall {Н+ ДЖЕ ЖЕК A В. 


Setup code in swap add 


l swap add: 

2 pushl &ebp save old %ebp 

3 movl %евр,Ферр Set ebp as frame pointer 
4 pushl ЖеБх Save Webx 


过 程 swap. add 党 要 用 寄存 器 %ebx ТАНЫ ЫН. DEUX dE -ТЕЯНЕ ЕЖЕН, С 
HEHBATR TE A Bot t wf 0] р ЖАҚ. 
Pr AE swap add 的 主体 代码 : 


Body code іп swap. add 


5 movl 8(Жерр),%ейх Get xp 

5 movl 12($ebp),€ecx Get ур 

7 movl (€edx),£€ebx (re! x 

d movl іЖесх!,Жеах Gret y 

9 movl Феах, (edxl Store y at *xp 

10 movl Ферх, (£ecx) Store x at *yp 

11 addl %ebx,%eax Set retur value 2 xy 


这 成 代码 从 caller ЮЖН НН ЕЁ 0. НУЛА CERE) 7. AES RI Ё СЕМИ 
对 于 %ebp BJIHI ИЧ жс 12 和 -6 | НЕ ерр ЯНА НУ А12 FAS. Е, ER x Bb y BJ 
HETRE EA eax 中 作为 退回 值 传 递 的 。 

КІН swap add 的 结尾 代码 ; 


Finishing code іп swap. adi 


12 popl Жеһх Restore ерх 
13 movl %ebp,%esp Restore %esp 
lá popl %ерр Restore Фебр 
15 ret Return to caller 


ЖЕКЕН у ТРЕЕ Феһх. wesp #l%ebp 1916, ЕТ ret 指令 。 注 意 ， 吕 以 用 一 
Ж leave EP VAB 13 和 14。 不 同 版 本 的 GCC 对 此 可 能 会 有 不 同 的 习惯 ， 
КЕМ caller 中 的 代码 紧 跟 存 调 用 swap add 的 指令 后 而 : 


б movl %#еах,%®едйх Resume here 


M swap add 退回 时 ， 过 程 caller 会 从 这 条 指令 开始 继续 执行 。 注意 ， 这 条 指令 将 返回 值 从 %eax 
ENIA “个 寄存 器 ， 


练习 题 3.16 

给 定 一 个 习 函数 

1 int proc(void| 

{ 
int х,у; 
scanfí("$x Sx", Бу, ки); 
reLurn x-y; 


CLE aD іл [М 
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GCC 产生 下 面 这 样 的 汇编 代码 ， 


і proc: 
2 pushl %еһрр 
3 movl *esp,€ebp 
4 subl $24,$esp 
5 addl $-4,%евр 
6 leal -4(£$ebp),eax 
7 pushl Феах 
8 leal -8(£$ebp),€eax 
9 pushl %еах 
10 pushl 5.100 Pointer to siring "ox "ex" 
11 call scanf 
Diagram stack frame at this point 
12 movl -8(Жеррі,Зеах 
13 movl -4i$ebp),€*edx 
14 saubl *eax, %ейх 
15 movl €edx,*eax 
15 movl #*ebp,*esp 
17 popl $*ebp 
18 ret 


假设 这 程 proc Fhir, PAPST. 






(5009040 
ПхЕ 0060 | 


假设 proc 调用 scanf( 第 LEIT), 而 scanf 从 标准 给 入 读 入 值 0x46 和 0x53, 842 57 ATP “%х Фх” 


看 放 在 存储 器 位 置 0x300070. 


А. ЗАТ E. %ебр ik kak K K T $ y? 

B. 局 部 变量 x de y #0 ЛОН ЖА? 

C. $ 10 行 后 名 esp 的 值 是 多 少 ? 

D. ë H HE scanfiÉ 115 proc 的 栈 帧 的 图 ,请 包括 尽 可 能 多 的 关于 楼 帐 元 素 的 地 址 和 内 容 的 信 息 ， 
E. 指出 proc A R| HAARA 【分 配 这 些 浪费 了 的 区 域 是 为 了 改进 高 速 缓存 的 性 能 )。 


3.75 iu 


二 一 让 中 摘 述 的 栈 和 和 链接 惯例 使 得 过 程 能 够 递归 地 调用 它们 自身 。 因 为 每 个 调用 在 栈 中 部 有 生 


日 已 的 秘 有 空间 ， 过 个 未 完成 调用 的 局 部 变量 不 会 相互 影响 。 迪 外 ， 拒 的 原则 很 自然 地 就 提供 了 适 
当 的 策略 ， 当 过 程 被 调用 时 分 也 局 部 存储 〈storagey， 当 返回 时 释放 存 情 。 


图 3.20 给 出 了 递归 的 Fibonacci PEUT) C 代码。( 注 意 ， 这 段 代 码 的 效率 很 长 ~ 一 我 们 用 它 来 作 


为 一 个 说 明示 例 ， 这 不 是 一 个 很 聪明 的 算法 ,) 完整 的 汇编 代码 如 图 321 所 示 。 


coder/asm/fib.c 
int fib,recíint n) 


( 


int prev val, val: 
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— 





33% 
4 
5 if іп <= 2) 
6 return 1; 
7 prev val = Тір тесіп-2%; 
В val = fib гесіп-1); 
9 return prev val + val; 
1ü } 
3.20 递归 的 Fibonacci £f СЕ 
L fib rec: 
Setup code 
2 puskl %еһр Save old %ebp 
3 movl Фенр,Ферр Set Згерр as frame pointer 
4 subl S16,%esp Allocate 16 bytes on stack 
5 pushi %esi Save Tesi (offset -20) 
6 pushl %ebx Save Übebx (offset -24) 
Body code 
7 movi В{%еЬр),%еһрх Get n 
8 cmpl $2,*ebx Compare п:2 
9 Jle .L24 tf <=, goto terminate 
10 3ddl s-12,%esp Allocate 12 bytes on stack 
1] leal -2(€$ebx],$€eax Compute n-2 
12 pushl %еах Push as argument 
13 cal. fib rec Call fib recin-2) 
14 TOV. X*eax,tesi Store result in %esi 
15 add. 5-12, %езр Allocate 12 bytes on stack 
16 lea. -lí(*eox),*eax Compute n-7 
17 pushl %еах Push as argument 
18 cal. fib rec Call fib rec(n-1) 
19 add. %$esi,šeax Compute val+nval 
20 jmp .125 Goto done 
Terminal condition 
terminate: 


21 „144: 
2 mov, Sl,€eax 


Finishing code 
23 4285: 
24 leal -24{жеЬр),%евр 
25 popl ЗеБх 
26 popl $esi 
37 movl *ebp,tesp 
28 popl $ebp 
29 rat 

图 3.21 


Return value 1 


Попе: 


Set stack to offset -24 
Restore Webr 
Restore Желі 
Restore stack pointer 
Restore %ebp 

Кешіп 


3.20 中 递归 的 Fibonacci ЕН ЕШ 
ERREA ӘЛЕ, 但 还 是 值得 仔细 研究 一 下 的 。 建 立 代 码 【〔 第 2 一 6 行 ) ВЕ ЕШ, ВЫ 


code/asm/fib.ec 
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&%ерр AIHE ATERIB 16 ЕН. (EE ЕНЕ FREE EAE besi ерх 的 值 ， 如 图 3.22 
XML. Ар, OEI ерх 来 保存 过 程 参 数 m (Ж 717). Н rib ARTE. ТИШКЕ 
到 第 22 行 ， 在 此 将 返回 值 设 为 1。 


在 第 一 -多 
i gigi n ІЖІНІҢДІЙІ 


АР 
IF Fol 








нив 


ED 
ЕНЕ Жанр 








图 3.22 ЖЕ Fbonocci AAt 
АЕ ч МА Бе iB ПАН АНКА. 


NUT ER ШЖ ТӨ, 39105-12 会 进行 第 一 次 递归 调用 , 这 包括 在 栈 中 分 配 不 会 被 使 
用 网 地 个 字 节 ， 然 后 将 计算 出 来 的 值 n? 压 入 栈 中 。 此 时 ， 栈 帧 如 图 3.22 右边 所 示 。 然 后 ， 它 会 
进行 递归 讽 用 ， 引 起 一 人 达 串 的 汕 用 、 分 配 栈 帧 、 对 局 部 存储 进行 操作 ， 等 等 。 每 次 调用 返 国 时， 它 
部 会 释放 栈 空间 ， 恢 复 所 有 被 烙 改 过 的 被 调用 者 保存 寄存 器 。 因 此 ， 当 我 们 返回 到 当前 调用 时 《第 
14 行 )， 我 们 可 以 假设 寄存 器 %eax 包含 着 递归 调用 返回 的 值 ， 而 寄存 器 和 ebx 包含 函数 参数 n 的 值 。 
iR (САҚТАН prev_val) 存放 在 寄存 器 %esi 中 【第 14 行 )。 通 过 使 用 被 调用 者 保存 
寄存 器 ， 我 们 能 保证 在 第 二 网 递归 调用 后 这 个 值 仍 然 是 可 用 的 。 

指令 157-17 进行 第 二 次 递归 调用 ， 它 会 再 次 分 配 不 会 被 使 用 的 12 个 字 节 ， 并 将 值 n-1 БАН 
中 。 在 这 个 亩 用 之 后 (第 18 行 )， 计算 出 米 的 结果 会 放 在 寄存 器 %eax 中 ， 而 我 们 假设 前 一 次 调用 的 
ARULA езі 中。 两 者 相 加 得 到 返 问 值 (第 19347). 

完成 代 人 码 恢复 寄 本 占 和 有 释放 栈 帐 。 它 首先 将 栈 幅 设置 为 保存 的 %ebx {ТИР А. ТЕК. IB 
算 相对 于 免 ebp 值 的 栈 的 位 置 ， 无 论 是 否 满 是 中 止 条 件 ， 计 算 都 会 是 正确 的 。 


2 ЖЗ АИА С 编 详 器 会 为 这 个 函数 在 栈 中 分 配 这 人 么 多 的 未 使 用 存 本 ‘storage)。 
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3.8 数组 分 配 和 访问 


C 中 教 组 是 一 种 将 标量 型 数据 紫 集 成 更 上 人 数据 类 型 的 方式 。C 用 来 实现 数组 的 方式 非常 简单 ， 
因此 很 容易 翻译 成 机 器 代码 。C 的 一 个 不 后 寻 锁 的 特点 是 可 以 对 数组 中 的 元 素 产 生 指 针 ， 半 对 这 学 
ЮГА, АЯ {ЕГАР ЕНИН И. 

优化 编译 器 非常 善于 简化 数组 索引 所 使 用 的 地 址 计算 ， 不 过 这 使 得 C 代码 和 它 到 机 器 代码 的 翻 
评 之 加 的 对 应 关系 很 难 理解 。 


3.8.1 基本 原则 

HATARAN TAREA М, EH 

T A[N): 
有 两 个 效果 。 首 先 ， 它 在 存储 器 中 分 配 ( L N 字 节 的 连续 区 域 ， 这 里 工 是 数据 类 者 了 的 人 小 Св 
Мол M), (ИН х о в. НК, КУЛА ГАКА, А 可 以 用 来 作为 指 同 数组 着 类 
的 指针 。 这 个 指针 的 值 就 是 х, MARNA 0-1 之 间 的 整数 索引 来 访问 数组 匹 素 。 数 组 元 素 N 
ERARA х + Loi 

lA), ИЗИПЖА А TIA HAAN: 


char АР12]; 
char *B[8]; 
double С[6]; 
doukle  *nD[5]: 


Беу EA ИН: 





数组 A Е 12 个 单 学 节 (char) 元 素 组 成 。 数 组 C H 6 TME ННН, МНЕ 8 + 
季节 。B 和 了 都 是 指针 数组 ， 因 此 每 个 数组 元 素 帮 是 4 j E, 

IA32 的 行情 器 引用 指令 被 设计 用 来 简化 数组 访问 。 例如, 假设 人 是 一 个 整数 数组 ， 而 我 们 想 计 
5 ED]. ЖЕ, 已 的 好 址 存放 在 寡 存 器 %edx 中 ， 而 i 存放 在 寄存 器 锡 ecx H, RA., IB 


movi ІЗейх,%есх,4),%сах 


ЛАЙ НИНЕН х +44. 在 该 存储 器 位 置 执行 读 操 作 ， 并 将 结果 存放 在 寄存 器 %eax 中 。 提 未 ， 伸缩 
四 了 于 1、2、4 和 8 通用 于 基本 数据 类 型 的 大 小 。 


5 5] 3,17 
ЖЕТЕ ЕНД, 


short 5[7]; 
short *T[3] 
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short **U[6]; 
long double VIB]: 
long double *w[4]; 


ЖУТА, ван in it Ka. ЖАНА K. АДДА, i865. 





3.82 ”指针 运算 

С 允许 对 指针 进行 运算 ， 而 计算 出 来 的 值 会 根据 该 指针 引用 的 数据 类 玲 的 天 小 进行 调整 。 世 器 
是 说 ， 如 果 p 是 一 个 指向 类 型 的 数据 的 指针 ，p HEA x. KEA prn WÉS n+ L. b REL 
Rf TRA. 

单 操作 数 的 操作 符 此 和 * 可 以 产生 指针 和 间接 引用 指针 。 也 就 是 ， 对 于 一 个 表示 某 个 对 象 的 表达 
A Expr &Expr s “АННЕ. АҒ АННЫ ДА, Addr-Expr, *Addr-Expr 2/7 RUE n! 
ЖИЕ. DLE. RIAA Expr 5% Ех 是 等 价 的 。 可 以 对 数组 和 指针 应用 数组 下 标 拘 作 ， 如 数组 引用 
起 由 表达 式 * 太 4 是 一 样 的 。 它 计算 第 i 个 数组 元 素 移 地址 ， 然 后 访问 这 个 存储 器 位 置 。 

扩充 一 下 我 们 前 面 移 例子 ， 候 莘 整 数 数组 E 的 起 始 地 址 和 整数 索引 i 分 别 存放 在 寄存 跨 %edx 
和 Recx h, КА 一 些 与 E 有 关 的 表达 式 。 我 们 还 给 出 了 每 个 表达 式 的 汇编 代码 实现 ， 结 果 存 放 
在 寄存 器 免 eax P., 


Е Int * movl Фейх, %еах 

E[4] МГ! | rovl ($edxj, %еах 

E[1] ; Мх | rovl i&edx, еси, 4), Seax 
&E[2] xgr8 | leal В{%ейх), *eax 

E«1-1 іп" ygt4i-4 | leal -4i$edx, %ecx, 4), t*eax 
*( Е[1]+1) | Miret] | movl ($ейх, Зесх), $eax 





&E[11-E i | movi €&ecx, Жеах 


(ES BI HB, leal 指令 用 来 产生 地 址 ， 而 mov 用 来 引用 存储 器 (除了 在 第 - -种 情况 中 ， 那 里 
Е Д НЬ). 最 后 一 个 例子 表明 我 们 可 以 计算 同 :个 数据 结构 中 的 遇 个 指针 之 差 , 结果 值 是 
除 以 数据 类 型 大 小 后 的 值 。 


练习 是 3.48 
TIR AL EUM АСЕН S 的 地 址 和 整数 索引 i 分别 存放 在 寄存 器 名 edx Pheer 中 。 对 下 面 每 个 表达 式 ， 
绘 出 它 的 类 型 、 值 表达 式 和 汇编 代码 实现 ,如果 结 果 是 指针 的 话 ， 要 保存 在 寄存 器 %eax 中 ， 如 果 是 
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HER, ЖАНА Л/ЖФах Ф. 


| ER е а | тән - 
ы |12). 
° j doo - 
эп ||). | 
sn БЕНЕН И 
яз |124. Eo 


3.8.3 ЯУ 








ОВИ ру, WAAR SAES НІНЕ, ЛЕ Н А т. m, 
图 3.23 (а) ТАЧ S decimals. ИШЕ - H 5 个 十 进 制 数 学 的 数组 表示 的 整数 。 在 把 这 
个 负数 转换 成 汇编 代 但 的 过 程 中 , 编译 器 产生 的 代码 类 似 于 图 3.23(by( H СЯЯЖ decimal5_opt。 
Hob. 它 不 会 使 用 循环 变量 i, 而 是 用 指针 运算 来 依次 这 历数 组 元 素 。 它 计算 出 最 后 一 个 数组 元 素 
的 地 址 ， 并 且 把 与 这 个 地 址 的 比较 作为 循环 测试 。 最 后 ， 它 能 使 用 do-while Е, Вр 


行 一 次 循环 体 。 


图 3.23 (с) 中 所 示 的 代码 给 出 了 一 个 进一步 的 优化 ， 以 避免 使 用 整数 乘法 指令 。 КЕИШ. ЕЕ 
FH leal (第 5 行 ) 来 计算 SYval 作为 val+H4*val。 燃 后 ， 用 伸缩 因子 值 为 2 W lea (第 7 行 ) 使 之 扩展 


А 10*val. 
1 int decimal5(int *x) 
2 { 
3 int 1; 
á int val = 0; 
2 
5 lor {1 = Ü; 1 < b; i++) 
7 val = (10 * val) + x[i]; 
B 
9 return val; 
10 ) 
(a) ЕН СІНІҢ 
1 int decimal5 opt {int *x) 
2 i 
3 int val = D; 
4 int *xend = x + 4; 
5 
is do | 





code/asm/decimal5.c 


code/asm/decimal5.c 


code/asnyadecimal5.c 
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7 val = {10 * val) + *у; 

8 X++: 

9 ) while (x <= xend); 

10 

11 return уа_; 

là } 

— c. coude/asmvdecimal5.c 
(h) 等 价 的 指针 代码 
Body code 

1 movi B(tebp),*ecx Get base addr of array x 

2 хог1 %еах,%еах үйі = 0; 

3 leal 15!1%ecx) ,Sebx xend = x+4 (16 bytes = 4 double words) 

4 ,.L12: Inop: 

5 leal |Жоах,%еах,4),Жейіх Compute 5*val 

b movil (*€ecx],€*teax Compute *x 

7 leal 4%гах,%едх,2),Феах Compute х + 2*(5*vyal) 

8 addl $4,*ecx K++ 

9 cmpl *ebx,$*ecx Compare x:xend 

10 Је .L12 if <=, goto loop 


Cc) 在 应 的 汇编 代码 


图 3.23 ”数组 循环 示例 的 C 和 汇编 代码 
编译 器 产生 的 代 癌 类似 于 decimals opt 中 所 未 的 指针 代 冯 。 


әз» НОЕН Т | 

在 较 老 的 TAS ЖОЕ ЙЛЫ T, ҰЛАН ЫР ПЕРИ, алт OR. 
ARAT. FIEL P MOGLIE Т, ЖЕНА АҖЕЗЛ МИИ, MELO k ЖАН 
样 的 优化 了 。 


3.84 ЭН 

好 恒 是 创建 数组 的 数组 时 ， 数 组 分 配 和 引用 的 通用 震 则 也 是 有 效 的 。 例 如 ， 声 明 

int A[41131; 

SUL T P: BH 

typedef int row3 t[3]; 

row3 t A|4]: 

数据 类 型 row3 t 被 定义 成 一 个 三 个 整数 的 数组 。 数 绍 A 包 告 有 由 个 这 样 的 元 素 ， 每 个 都 需要 
12 个 字 市 来 存放 三 个 整数 ， 所以， 总 的 数组 大 小 为 4.4,3=-48 字 节 。 

数组 A 还 可 以 看 成 是 一 个 4 行 3 列 的 二 维 数组 ， 从 AOA A[3][2]。 数 组 元 素 在 存储 器 中 是 


按照 “ 行 优先 ”的 顺序 排列 的 ， 这 就 意味 着 先是 行 0 的 所 有 元 素 ， 后 面 基 行 ! 的 所 有 元 素 ， 依 此 类 
推 。 
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Л.Ж 
] [ 
[ 
[ 
1 


















1] 
A (| [2] 

НЕРУЕ ТЕА Е, W A 看 成 一 个 四 元 素数 组 ， 每 个 元 素 又 是 一 个 二 个 ini 
的 数组 ， 我 们 先 有 А(ОІ ERETO, БЕ АШ, futs. 

到 访问 和 多维 数 组 中 的 元 素 ， 编 译 器 产生 的 代码 要 计算 待 访问 元 素 的 偏 称 ， 然 后 骨 用 movl 指令 ， 
VC PRSE EHE, (ES CnD BER EE ELIEARR ALTO 作为 索引 。 通 常 ， 对 一 个 声明 如 下 的 数 
21. 

T DIR1 IC] ; 

ГА л ОНЕУ TE de HUE x, L(C i+ DIS E L E sk НЕТ». 

а F HX B|, ЖШ ХШ 4 x 3B. BRERA eax f x. Фейк 保存 
Жі, Mže TE ј. Ат, PIENE Ug ANE ЛТ Феак: 

А іп Феах, i in Фейх, j ің Фесх 






- sall $2,$ecx j*4 

2 leal ($edx,€edx,2), %едх Р * 1 

Е leal (Жесх,Жесх,4),%е4х ])*441*12 

d movi {%еах,%ебх),%еах Read M[x4 + 4(3 ` i € р] 
ЗІМ 3.19 

考虑 下 面 的 源 代码 ， 此 处 ，M 和 凡是 用 +define 声明 的 常数 ; 
tdefine: 

1 int matl[M][N]; 

à int mat2[Ni (MJ: 

3 

Д int sum elementíint i, int 1) 

5 { 

5 return matl[i][j] + mat2[jl [i]; 

7 ) 

在 编译 这 个 程序 时 ，OGCC 会 产生 下 面 这 样 的 汇编 代码 ; 


1 movl &{%еБр),%есх 
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movl 1л{%ерр),%еах 

leal 0{,Феах, 4), Sebx 

leal 0(,%Жесх,8),Фейх 

subl Фесх, жесіх 

addl *$ebx,*eax 

qall &2,%еах 

movl matzZi$9$eax,£€ecx,4),€eax 
айал matlí&ebx,€*edx,d],£eax 


ж BL 4 5385) ТЗН Bb. MAE KOL ЖАРААТ M IN НИ, 


3.85 ”固定 大 小 的 数组 

对 回 定 太 小 的 多 维 数组 进行 操作 的 代码 ，C 编译 器 能 够 进行 多 种 优化 。 例 如 ， 和 假设 我 们 将 数据 
2 Д) fix matrix 声明 为 16x16 的 整数 数组 : 

1 #define N 16 

2 typedef int fix matrix[N][N]; 

图 3.24 (а) 中 的 并 个 计算 矩阵 A 和 B 的 乘积 的 元 素 i. k. СН ЕН КИЕ НИЕ 3,24 
cb) 中 所 示 的 那样 ， 这 段 代 码 和 包含 很 名 聪 绷 殉 优 化 。 编 译 哈 认 出 御 环 倒 依 次 访问 数组 А 的 元 素 
六 HO]，AQJ[H;，*…， 友 自 [15]。 这 些 元 素 占据 的 是 存储 器 中 从 数组 元 素 A[ijllo] 的 地 址 开始 的 相 邻 的 
位 置 。 因 此 ， 程 序 可 以 用 指针 变量 Apr 来 访问 这 些 连续 的 位 置 。 循 环 会 依次 访问 数组 ВЛЕ 
В|О]|К], ВІҢІҢ, `, B[15][k]. RETTERE PAAA BOB Tr 
分 别 相距 64 -E 1. Bist. EFAA RE Bpr 来 访问 这 些 连续 的 位 置 ， 在 CC 中 ， 这 个 指针 
会 增加 16， 上 尽管 实际 上 真实 的 指针 会 增加 4. 16= 她 。 最 后 ， 代 码 可 以 用 一 个 简单 的 计数 器 来 记录 


шы Os — (лыш io EJ 


code/asm/array.c 
1 #define N 16 
2 typedef int fix_matrix[N] [N] ; 
3 
4 /* Compute i,k of fixed matrix product */ 
5 int fix prod ele (fix matrix А, fix matrix B, int i, int k} 
Б { 
7 int 1; 
B int result = 9; 
9 
10 for (j 20; j < N; j++) 
11 result += A[i]:j] * B[j][k]; 
12 
13 return result; 
14 | 
code/asm/array.c 
(а) БЕС feu 
соағуазтуағғау.с 


1 /% Conpute i,k of fixed matrix product */ 
2 int fix prod ele optífix matrix A, fix matrix B, int i, int k) 


138 %3% 


3 

4 int *Aptx = ҺА[1][0]; 
5 int *Bptr = ЕРІІГІКІ; 
5 int cnt = N - 1; 

7 int result = 0; 

2 

9 do 1 

10 result += I*AptT) * (*Bptr): 
11 Aptr += 1; 

12 BpLr += HN; 

13 спі--; 

14 + while (cnt >= 0); 
15 

15 return result; 

li | 





———— ‹—— +. ———— ,—————.a 


(b) OUR СТЫ 
图 3.24 [CBE RULES CER, ОЕ ЕСЕ НААН ВЕ ЕА Ж 1. К 
а ПЕНА EDU. 
ЭП Н f fix pred ele opt С 104. ЖӘНЕ С A ES E EN 编 时 所 使 用 的 优化 。 卞 面 是 
ЧИИ B SE БЕТ CR 


Аріт is in *bedx, Bptr in Фесх, result іп Kesi, ent in Webx 





code/asm/array.c 


1 .L23: loop: 

2 mov] (%ейх),%еах Compute t = *Aptr 

3 imull (%єсх),%еах Compute v = *Bptr * t 
| addl %еах,%ез51 Add v result 

t add: 584, %есх Add 64 to Bptr 

6 addi 54,%е4х Add 410 Aptr 

7 deci €ebx Decrement cnt 

B ins .L23 if >=, if >=, gato loop 


注意 ， 人 在 上 面 的 汇编 代码 中 ， 所 有 的 指针 增加 量 均 乘 以 伸缩 因 千 值 4。 


练习 题 3.20 
Tih CARB- TEE A atA AALE x val. 


/* Set all diagonal elements to va] */ 
void fix set diaqí(L:ix matrix A, int val) 
i 
int 1; 
[or {1 = Ú; i < N: i++) 
А[11{11 = val; 


-] м іл B be БО pp 
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ШЫ, GCC 产生 如 下 汇编 代码 ; 


movl 12{%ерр) ,Sedx 
mov] В{%аерр),%еах 
movl S15,$ecx 
addl 51020,*Xeax 
.pZalign 4,,7 Added to optimize cache performance 
‚д: 
movl %едх, І%сах) 
addl 5-63,%ëax 
десі %есх 
0 Jns .Lb5ü 
创建 一 个 C RERA, R Tk IL ФАИНЕ, ҚЗ 324 (b) 中 的 
代码 一 致 ， 


3.8.6 205578. Е 

СЛУ АЕРУ LBS КИЕТ НЕЕ OTA а НО. ФТ Ву ЛТ, 
ЖИП Ж МИНЕ УЯ да АС ЧЕК А ЛЕ ПИТ ТЕ. ЖЕ, RELE KH 5 ШАН 
到 ЕАН НОВА У, ЖОТІН АЖ ЖЕ ЕЛІ var matrix 简单 地 定义 为 int *: 

typedef in; *var matrix; 

我 们 用 Unix ШЖ 638 calloc 来 为 “个 ax 的 整数 数组 分 配 和 初始 化 存储 : 

1 var matrix new var matrixíint п) 

2 { 

4 return {маг matrix) callocíisizeof(imt)], n * n); 

j ) 

саПос ЕЭ (ANSI C 文档 的 “部 分 32，401 有 两 个 参数 ， 每 个 数组 元 素 的 大 小 和 所 青 数组 元 
素 的 数 日 。 它 试 者 为 整个 数组 分 配 空间 。 如 果 成 功 ， 它 会 将 整个 让 侍 器 区 域 初始 化 为 0. JE EUR 
HIS ГТ 说 的 指针 。 如 果 没 有 足够 的 可 用 空间 ， 它 就 返 可 室 (null), 
ШС: С. Cem Java hinay fii ipin 

在 总 中 ， 堆 【一 个 可 以 用 末 存 该 教 据 站 构 的 存储 器 池 ) 中 的 存储 分 配 是 用 的 库 函 数 malloc Ж 
саНос. "ET E ЖАА CH+ 和 Java 中 的 new Ж. C 和 C++ 都 更 求 程序 型 式 地 用 free ib de IE 
AK Om BUS EP. f Java P, AAEREN AMAA garbage collection (垃圾 圆 收 】 的 
进程 自动 完成 的 ， 第 吉 童 中 会 讨论 这 小 话 题 . 


Жүн, ӘЛІН ЕНЕ КИЯЛ ЕЕЕ jM D пед 


неш CO — См іл ou ы М1 e 


| int var_ele(var matrix А, int i, int j, int n) 
2 { 

3 return А[11*п) + Jj; 

4 ) 


BUE QA iX Y BN: 
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1 movl В{%ерр),%еах Get А 

2 movl l21%ebp),*eax Get | 

3 'mull 22 (%ерр), *еах Compute n*i 

4 addl 16(%ерр},%еах Compute n*i + j 
5 novl |%гіх,%Жеах,4),Феах Get A[1*n + ji 


АНЫН ЕЕ ЛЕШ КЕНИНЕ. ЖЇН [Sa AK H IM TS ЕР 
用 ESEHdBS 1E Аа, MAERA- ЕТА S. ЖҚА, АЯЗ АЛА, 
ж ЛД ТЕ Bein A. 

КЕНЕ, ТЕН А ИЕ ШИ RET ЖИПТЕ 3 E АХУН OE HG d ЖЕНЕ kai 
变数 组 的 下 标 计 算 。 Bi 3.25 (а) riff) C ЖЕ, ИЯНЕ F K DIERE AHB МЕН 
Bjz Ei. k. TTE 3.25 (h) 中 ， 我 们 给 出 了 EBERT RUE E n ba R Pn ЧЕ ЕГИ 
TUB n ан. pasu БАЖ НЕЛЕ ЕКЕНИ ЕНИ, Е ЗЕ isn 和 jtn, EI 
种 情况 中 ， 编 详 器 不 会 产生 指针 变量 Bpr WEGE ARIRAN ТІР CAO “п ЕДІ ІК?) 
的 整数 变量 ， 因 为 相对 于 原始 代码 ， 它 的 值 等 于 n#j+k。 最 开始 时 ，nTjpk 等 于 k， 每 次 循环 时 都 增 
п. 


code/asm/array.c 
1 Lypedef in: *var matrix: 
2 
3 Ж Compute Lk of variable matrix product */ 
3 int var prod elelvar matrix А, var matrix B, int i, irt k, int n) 
5 i 
5 jnt j; 
7 int result = 0; 
H 
9 for [j = 0; J < n; j++] 
10 result += A[i*n + j] * B[j*n + k]; 
11 
12 return result; 
13 1 
code/asm/array.c 
Са) Bagai C çM 
-- code/asm/array.c 
1 ЖСоөтрше ik of variable matrix product */ 
2 int var, prod ele optí(var matrix А, var matrix B, int i, int k, int n) 
E 1 
4 int *Aptr = &A[i*n]; 
c int ПТІРЕ = n; 
Ë int cnt = n; 
E int result = 2; 
ü 
3 1f (n <= Q) 
10 return result; 
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11 
12 da { 
13 result += {*Арїт} * B[nTjFk]; 
14 Aptr += 1; 
15 nTjPk += n: 
15 спЕ--; 
17 b while (cnt); 
18 
19 return result; 
20 ] 
code/asm/array.c 
(b) ЧЫЧА C 代码 
Ж 5.25 YM Ж КФ ОЕ ЖИИ ЛЖ. K PR Ee DEVE PS 
Ie EE HR ze ELE TERCERO H = 


编 详 器 为 循环 产生 代码 ， 其 中 寄存 器 %edx 保存 cnt. 9bebx 保存 Ари. Фесх PRAF nTJPK. 而 Wesi 
保存 结果 。 这 段 代 码 如 下 ， 


] „L37: іпор: 

2 шоу! 12 (%ерр), %еах Get B 

3 movi (sebx),%edi Get *%Арїт 

4 addi S4,%ebx Increment Áptr 

5 imull :Феах, Фесх,4),%еаі Multiply by B[nTjPk] 
6 addl €edài,*esi Add ta result 

7 addl 24(%ebp),%ecx Add n to nTjPk 

B deci %ейх Decrement спі 

9 jnz .L37 If cnt != 0, gotoleop 


注意 , 每 次 御 环 时 , 变量 B 和 n 者 必须 从 存储 器 中 读 出 。 这 是 一 个 寄存 器 溢出 (register spilling) 
的 例子 。 没 有 是 移 的 寄存 器 来 保存 所 有 需要 的 临时 数据 ， 因 此 编译 器 必须 将 某 些 局 部 变量 放 在 存储 
iP. ЖҰ, ЛИЧЕШЕ B 和 mn， 因 方 它们 只 用 读 一 次 一 一 在 循环 里 ， 心 们 的 值 不 变 。 
寄存 器 溢出 是 TA32 一 个 很 常见 的 问题 ， 因 为 处 理 器 的 寄存 器 数量 太 少 了 。 


39 开 尖 的 数据 结构 


C 提供 了 两 种 将 不 同类 型 的 对 象 结合 到 一 起 来 创建 数据 类 型 的 机 制 ， 结 构 structure )， 用 关键 
F struct 来 声明 ， 将 多 个 对 象 集 合 到 一 个 单位 中 ， 联 令 nion), MXF union X58], ЖҮРЕ JL 
种 不 同 的 类 型 来 引用 一 个 对 象 。 
3.9.1 结构 


C 的 stet. 吉明 创建 一 个 数据 类 型 ， 将 可 能 不 同类 型 的 对 象 豪 合 到 一 个 对 象 中 。 绪 构 的 各 个 组 
成 部 分 是 用 名 字 来 引用 的 。 结 构 的 实现 类 似 于 数组 的 实现 ， 因 为 结构 的 所 有 组 成 部 分 都 存放 在 存储 
路 中 连续 的 区 域内 ， 而 指向 结 梅 的 指针 就 是 结构 第 一 个 字 节 的 地 址 。 编 详 器 保存 关于 每 个 结构 类 型 
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fMi. НА Спе) AY iit. Tit t i ЕЗІННЕ ЕНУ, Mamm 
ЯЛЫ ЖІ. 


给 心 语言 初学 者 : 将 一 个 对 象 表示 为 struct 

struct 436 3€ 79 ТІВ АҚ ( constructor ) Æ C 提供 的 与 C++ 和 java 对 象 最 为 接近 的 东 码 ,尼克 
许 程 库 负 保存 关 于 一 个 数据 站 机 中 某 些 实 栖 的 入 息 ， 并 用 名 字 来 引用 这 些 信 息 ， 

鲍 如 ， 一 个 图 形 程序 可 能 要 用 结构 来 表示 一 个 长 方形 ， 


struct rect { 


int lix; /* X coordinate of lower-left corner */ 
int liy; /* Y coordinate of lower-left corner */ 
int color; /* Coding of color */ 

int width; 着 Width (in pixels) */ 


int height; /* Height (in pixels) */ 
}; 


载 们 可 以 声明 一 个 struct rect € ai HE 5， 并 将 它 的 域 值 设置 为 下 面 这 样 ， 


struct rect r; 
r.lix = r.lliy = 0; 
r.colcr = OxFFÜUFF; 
r.width z 10; 
r.heighbk = 20; 

这 里 表达 式 rx 353 8628 p 49 Ux 域 ， 

ЖОН HEAT — 4e 2 486 E813 КА, MEERE, XR Ra). e. КЕ 
(ddp X KG Mgm,XxE, Wii kawa — Td KA E struct ЯН: 

int areaí(struc- rect *rpl 

{ 

return í(*xp).width * (*rp).height; 

) 

ACK (жр) мањ 间接 引用 了 这 个 指针 ， 并 且 选 取 所 得 结构 的 width Я, 3X € 6 РАЈЕ, 
因为 编译 器 会 将 表达 去 srp.width 解释 为 <tmp.width)， 而 这 是 非法 的 。 间 接 引 用 和 域 选 取 的 联合 快 用 
非常 常见 , 以 至 于 CC 提供 了 一 种 作为 普 代 的 标识 符 ->, Рр 印 ->width 等 价 于 表达 起 (srphwidth。 例如 ， 
我 们 可 以 写 一 个 驶 数 ， 它 将 一 个 长 方形 向 鼎 床 转 昌 上 度 : 

void rotate leftistruct rect *rp) 

( 


РЕ Exchange width and height */ 

int t = rp->height; 
rp--height = rp-»width; 
rp-»width = t; 


} 


C++ 和 Java 的 对 象 比 C PAREA, НЕГЕЕ А AAE 
ЖЮН ЖАНА ECT. ANTAN ЕН АД, МЕ de BET ӘД 
area 和 rotate left. 
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让 我 们 来 看 看 这 样 Fb f, EIE КОА! НЕЛЕ ВИ: 
sLruct rec | 
int 1; 
int j; 
irt alā]; 
int *p; 
}; 
这 个 结构 包括 四 个 域 一 一 两 个 4 字 节 int、 一 个 出 二 4 字 节 int 组 成 的 数组 和 一 个 4 字 告 的 整数 
ETTI—— S E24 T T 
Ін 0 4 8 20 
内 容 
注意 ， 数 组 a 是 嵌入 到 这 个 结构 中 的 。 |: 图 中 项 部 的 数字 给 出 的 是 各 个 域 相对 结构 开始 处 的 字 
Tief. 


为 了 访问 结构 的 域 , ЕВР ЕМЕ EROR hh ht T. Ей 4034835. 例如 , 假设 stmct rec * 
RENEE ЖҮ wed 中 。 然 后 ， 下 面 的 代码 将 元 素 r 拷贝 到 元 素 >j: 


1 movl {Жедйх),%еах терм 

2 movl $eax,4iítedx) Store in r-»j 
因为 域 i НЕЕ 7; 0, TEARS Hos RE гн. ЖТ ИЖ j, CORTE r BUH HEH ЕЙ 
58 4. 


З — АЕ п ЖИР АРА ТИЕ, ВИА ЖИЫ НЫН КА ИЕЫ E. Dom, Ж 
АА 8 +4. 1-12, IEAA al). FERT %еах 中 的 指针 r 和 在 寄存 
өл bedi "PE EE RE 1, RITAR- АЕ ФР ЕТ Н alip: 

r in %еах, í m ех 
| leal 8{%еах,%#ейх,4),%есх %ecx= &r-»ali] 
还 有 最 后 一 个 价 子 ， 下 面 的 代码 实现 的 是 语句 ， 


г->р = &r->a[r->1 + г->1]; 


НЕН т ТЕЗ ЛЕН едх tB; 

1 mevl 4(%ейх),Феах Get r-»j 

2 acdl [%єйх),%еах Add r-»i 

3 leal В{%ейх,%еах,4),%еах Compute &r->Ír->1 + r-»j] 
4 movl $eax,20($edx) Store in ғ->р 


EAE bJ k BH ПЖ. АТНЫ ЖЛ IRL ЗЕ RE TER TEIG ABER. ЖЖ ЫШЫ $ X 
于 域 声明 或 域名 字 的 信息 ， 


练习 题 3.21 
者 虚 下 面 的 结构 声明 ， 


struc- prob í 
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int *0; 
struct í 
Int X; 
inb ү; 
} 5; 
struct prob *next; 
r: 
ТРАН ТРАКА BNET, SK R Ө ҮА ЖЕЛЕР 
在 数组 中 一 样 。 
тайи (Де ТДК А) 是 对 这 个 站 构 进 行 操作 的 : 
vöid sp_lnir[struct prob *sp) 
{ 
BD-»8. X 
Sp-»p 
ар->пехт 


ц ТА І! 


} 
A. 下 列 域 的 偏 物 量 是 多 少 | 用 字 
р: 
ax: 
S.Y: 
next: 
B. 这 个 结构 总 共 需 要 多 少 守 节 ? 
C. RERA sp init 的 主体 产生 的 汇编 代码 如 下 ， 
movi Bi%ebp),%eax 
movl 8(*eax),Sedx 
movl Фейх, 4 {%еах) 
leal 4|%сах) едх 
movl *edx,íteax| 
movl $eax,l2í&eax! 


IRAE IEEE, ЖШ sp init 代码 中 缺失 的 表达 起. 
3.9.2 联合 


+ 
> 
zr 


C ЮЛ Ш» Ша B e 


ТАЖ 


EC BUE I HAIR НЕС 的 类 型 系统 ， 允 许 以 多 种 类 型 来 引用 - АФ. S hi 
许 法 与 结构 的 语法 一 样 ， 只 不 过 语义 相差 比较 六 。 它 们 不 是 用 不 同 的 域 来 引用 不 同 的 存储 器 抉 ， 而 


是 引用 的 同一 存储 器 据 。 
Bu КЕНІН: 
struct 53 1 

char с; 
int 1121: 
double v; 
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}; 


union U3 1 
char c: 
int 1[2]: 
doubie v; 
}; 


БЕ [К ДЫ S3 和 U3 BS ДАЛАШ ТЁРЕЛЕ: 





(一 会 儿 我 们 会 看 到 为 什么 53 ФІМЖЕЕЛА W ASE 1.) 对 于 类 型 union U3 * 的 指针 р, 
p >с. р-> ОЯ р->у 引用 的 孝 是 数据 结构 的 起 始 位 置 。 还 要 注意 ， 一 个 联合 的 总 的 大 小 等 于 它 最 
大 域 的 大 小 。 
华 一 些 情 况 中 ， 联 合十 分 有 用 。 但 荐 ， 它 也 引起 了 一 些 讨 大 的 错误 ， 因 为 它们 绕 过 了 СМЖ 
统 手 供 的 交 全 指 施 。 一 种 应 用 情况 是 ， 我 们 事先 知道 对 一 个 数据 结构 中 的 两 个 不 同 域 的 使 用 是 互 斥 
的 ， 屠 各 将 这 两 个 域 作 为 联合 的 一 部 分 ， 而 不 是 结构 的 一部分， 会 减 小 分 配 空间 的 总 量 ， 
例如 ， 候 设 我 们 想 实现 一 个 二 又 树 的 数据 结构 ， 每 仿 时 了 节点 都 有 一 售 double 的 数据 值 ， 而 每 
个 内 部 节点 表 有 指向 项 个 孩子 节点 的 指针 ， 但 是 没有 数据 。 如 果 我 们 像 这 样 声 明 ; 
struct NODE { 
struct NODE *left; 
struct NODE *right; 
double data; 
}; 
ЖА ТУЕШ 16 ЕАУ, 每 种 类 型 的 节点 都 要 浪费 一 半 的 字 节 。 相 反 , 如 果 我 们 这 样 来 志明 一 
TO ER 
union NODE { 
struct 1 
union NODE *left; 
union NODE *right; 
} internal: 
double data; 
); 
WA. РУЫНЫН EES К, ДЕ n 是 一 个 指针 ， 指 向 union NODE * 类 型 的 节点 ， 我 们 用 
n->data 来 引用 叶子 节点 的 数据 ， 而 用 n->intemai.jeft 和 n-»intemal.right 来 引用 内 部 节点 的 孩子 。 
不 过 ， 如 果 这 样 编码 ， 就 没有 兴 法 来 确定 一 个 给 定 的 节点 到 底 是 叶子 节点 ， 还 是 内 部 节点 。 通 
帅 的 方法 是 引入 一 个 附加 的 标志 域 : 


struct NODE Í 
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int 15 leat; 
union 1 
atruc- 1 
struct KODE *left; 
struck NODE *right;: 
+ internal; 
double даа; 
) info; 

}; 

ХАЙ, ТУ uode. H 15 leaf mod. ПІЛІРІЛІГІ Жі, RRRA 0. ОСМА JL 
Ер МЕ: 15 leaf € 4 ^, infoanternal left M infointemal.right 8 4 +, 或 者 info.data # 8 T. 
fruc, ЖАРҒАН ЕН, ШИ ЖЫ ҒАМ АҚ. M TO ЕН КЕДЕ 
愧 ， 这 样 的 节省 公里 加 吸引 人 人 一些。 

镁 合 还 口 以 用 来 访问 不 同 数据 类 型 的 榨 的 开 式 .例如 ,下 和 而 这 段 人 代码 退 回 一 个 float 作为 unsigned 
的 位 表示 : 


1 unsigred floar2bit(fioat £f) 


2 L 

3 union 1 

4 float f; 

5 unsigned u; 
Б і remp; 

7 Lemp.f = f; 

% return temp.u; 
э n 


在 这 段 代 码 中 ， 我 们 以 -种 数据 类 型 来 存储 联合 中 的 参数 ， 又 以 男 一 种 数据 类 型 来访 问 它 。 有 
由 的 是 ， 为 此 过 程 产生 的 代码 三 为 下 面 这 个 过 程 产生 的 代码 是 一 样 的 : 


1 unsigned copy(unsigned u! 


2 L 

3 return u; 

4 } 

这 网 个 过 程 的 主 估 只 有 一 条 指 今 ; 
1 movl Bitebpl,&*eax 


ИЛЕН НЫН Т ЖАНЫН. АЛЕ Е T float, Е — 7 unsigned， 它 部 在 相对 于 
Фебр IgE: 8 5. PHP RS) P Bh И Д ЕРИН, LEE RTT. 
HARR ЖЕЕ ЖЛЕ АЛЕН АВА aa Er, F ТЛА ДЕ НВ 86 Г. БІЛ. 
概 疫 我 们 号 ЧЕ, КЕДЕН 4 £ Й unsigned 的 位 的 形式 ， 创 娃 :个 8 字 节 的 double: 
1 double bitZdouble(unsignec могай, unsigaed wordl) 
| union ( 
double d; 


unsigned 1121; 
} temp; 


C ұл e D RJ 
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Ту 
i 


В Петр.у[0' = wordü; 
9 Сєпр. 21111 = wordi; 
10 return temp.d; 


11 } 
ФЕВ ТАЗ? ЖЕНА; (little-endian) Ж L, 38 word0 会 是 d HERMA zm W, ІП wordl 
会 是 山 位 四 个 学 节 。 在 太 靖 法 《pig-endgian 》 HL. 上， 这 三 个 参数 的 第 色 刚 好 相反 。 


练习 题 3.22 
者 虑 下 面 的 联合 声明 ， 
union ele | 
struct 1 
int *р; 
inb y; 
) el; 
struct I 
int x; 
union ele *next; 
) e2; 
}; 


КЕННЕН ТАҚА С T, 
下 面 的 过 程 ОЖТ БАЈКА) 是 对 一 个 链表 进行 操作 的 ， 而 链表 的 元 章 是 这 些 联 合 : 


void proc iumon ele *up! 
1 
Цо-в = “г. ] - %р-> 

) 
A. ЕРДЕН ЕЛ $ Y (AFIAT)? 

el.p: 

el.y:i 

а2,Х: 

е) next: 


这 个 钻 构 总 共 需 要 多 少 字 节 ? 
编译 器 为 proc 的 主体 产生 的 汇编 代码 如 下 : 


B. 
C. 
1 
2 
3 
4 
2 
6 
7 
8 


movl 
mov) 
movl 
movl 
movl 
movi 
subl 


mow l 


Bt зебр), teak 
A[t*eax),t*edx 
(Жейх),Зесх 
%ерр,%евр 
(Жеах) , ћеах 
(Жесх),%есх 
teax,t*tecx 
%есх,4{%ейх) 


根据 这 些 信 息 , 填写 出 proc 代码 中 缺失 的 表达 趟 。 Ел 有 些 联合 引用 可 以 有 多 种 意思 的 解 样 . 


正如 虱 看 到 的 那样 ,在 进行 引用 的 地 方 ， ЕИЖАНЫЕЯ, 只 


一 种 答案 不 需要 进行 任何 类 型 转换 ， 
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也 不 会 违反 任何 类 型 限制 ， 


3.10 对 齐 (alignment) 


省 多 计算 机 系统 对 基本 数据 类 型 的 可 允许 地 址 做 出 了 一 些 限制 ， 旦 求 某 种 类 型 的 对 象 的 地 址 几 
ЖЯ дж Н k OBI. 42€ 8) 的 倍数 。 这 种 对 齐 限 制 简化 了 处 理 器 和 存储 器 系统 之 问 接口 的 硬 
件 设计 。 例 如 ， 假 设 一 个 处 理 器 总 是 从 看 赃 器 中 取 8 个 字 节 出 来 ， 则 地 址 必须 为 8 的 倍数 。 如 里 我 
们 能 保证 所 有 的 double 都 将 它们 的 地 址 对 齐 成 8 的 倍数 , 那么 号 可 以 几 一 个 存储 器 操作 来 读 或 者 写 
惜 了 。 否 则 ， 我 们 可 能 需要 执行 两 次 存储 器 访问 ， 因 为 对 象 可 能 分 斤 在 两 个 8 字 节 存储 器 块 中 。 

X Е АЗ, LA32 硬件 都 能 止 确 工作 ,不 过 ，Intel 6 e£ CR AUS UL A n ЕЕЕ 
统 的 性 能 。Linux ЖЕЕ ARE? TARAN {例如 short) PO URL 2 的 倍数 ， 而 较 大 
的 数据 类 型 (例如 jnt、int *、float 和 double) 的 地 址 必须 是 4 的 倍数 。 注 意 ， 这 个 要 求 就 意味 着 一 
个 short 闫 准 对 每 的 地 址 的 最 低 六 必须 等 于 0. 35 НЫ, ЖЕҢ iat 类 型 的 对 象 或 指针 的 地 址 的 最 低 岗 
{у Ж 0. 

Bit: Microsoft Windows 的 对 齐 

Microsoft Windows 对 对 章 的 要 求 更 严格 一 一 任何 大 字 节 ( 基本) 对象 的 地 址 都 必须 是 大 的 倍数 ， 
特别 地 ， 它 要 求 一 个 double 的 地 址 庶 该 是 吕 的 倍数 。 这 种 和 要求 提 裔 了 存储 器 性 能 ， 代 价 是 浪 禹 了 一 
些 空间 。Linux 中 的 设计 决策 可 能 对 386 很 好 ， 了 以 前 存储 器 十 分 缺 过 ， 而 存储 回 郑 线 只 有 二 小字 节 
宽 。 对 于 现代 处 理 器 来 说 ，Microsoft НИЯ JP ee Hot de ЕТ. 

命令 行 选项 -malign-double 会 使 Linux 上 的 GCC 为 double 类 型 的 数据 使 用 8 doe Ж, 这 会 
提高 存储 器 性 能 ， 但 是 在 与 用 4 字 节 对 痉 方 式 下 编译 的 库 代 码 链 接 时 ， 会 导致 不 兼容 ， 


确保 每 种 数据 类 型 帮 中 按照 指定 方式 来 组 织 和 分 本 的 , 即 每 种 类 型 的 对 象 都 满足 它 的 对 齐 限制 ， 
就 可 保证 实施 对 齐 。 编 译 器 在 汇编 代码 中 放 入 命令 ， 指 明 全 局 数据 所 需 的 对 齐 。 例 如 ，3.6.6 小 节 中 
跳 转 表 的 汇编 代 凤 声明 的 第 2 行 就 包含 下面 这 样 的 命令 (directivey》 


.align 4 


Bos UE ТВО (ТЕК. ЖӨН ЕЕ) 会 从 以 4 为 倍数 的 地 址 处 开始 。 因 为 每 个 
表 项 长 4 个 字 节 ， 后 向 的 元 素 都 会 遵守 4 字 节 对 齐 的 限制 ， 

ИВИ ӘКЕ PUES (例如 mallo 的 设计 必须 使 得 它们 返回 的 指针 能 满足 最 糟糕 情况 的 对 齐 
нен, ЖЕ 4 或 者 8。 对 于 有 结构 的 代码 ， 编 译 器 可 能 需要 在 域 的 分 配 中 插入 问 了 本 ， 以 保证 每 个 
КОЛ АВИ Хе CNA ER. MARATE NAHEA 一 些 对 齐 要 求 ， 

ШИЙ, ЖЕ КЩН ЖУПН: 

struct 51 : 

int i; 
char c; 
int J; 
rj 
ЖӨНІ RUM 9 字 节 分 取 ， 表 出 图 来 是 这 样 的 : 
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ің Ü 4 5 


d 
它 是 不 可 能 满足 域 i ( 偏 移 为 DO Aj ORBA 5 的 4 字 季 对 齐 要 求 的 。 所 以 ， 编 详 器 在 域 c 
和 j 之 何 插 入 一 个 3 字 节 的 间 队 《在 此 用 “XXX RZ): 
22 0 8 
J 


4 5 
NS а | е |жж [ 2 -— 


ҒАН, | mfEREO S. ШТУ K ЛЛ 121, 5. И ЛЕЙ LR UETETRE struct Sl * 
类 型 的 指针 p Ад 4 字 节 尘 弄 。 用 我 们 前 面 的 符号 ， 计 指针 pp Ja ль ЖА, х. 2 ЛЕ 4 的 倍 
数 。 这 就 保 计 了 poi СҢ x) HE posi Giit 4) {ЖКН АЗ DN BE K. 

男 外 ， 编 详 器 可 能 和 天 下 添加 一 些 填充 到 结构 的 末尾 ,这 样 结构 数组 的 每 个 元 案 都 会 满足 它 有 的 对 
ЖЕЖ. Piu. ЯЯ kI EAE ЕҢ: 

struct S23 1 

int 1; 
int ` 
char c: 

1; 

如 果 我 们 将 这 个 结构 打包 成 9 个 字 节 ， 只 要 保证 结构 的 起 始 地 址 满足 4 жая Ж. DAD 
ЖАНЕ TR uS AE P) АЖ. ЛУ, ЖЗ ГЕШ Л: 

struct 52 0414); 

pfi 9 т, 是 不 可 能 满足 d 的 每 个 元 囊 的 对 齐 要 求 的 , ЖЕК АПАЕ u ЕРКІНДЕ ӘНІ ха. 
X449. x 9 08 TL xu + 27. 

网 详 器 会 为 结构 81 分 配 12 个 学 节 ， 最 后 3 个 字 节 是 浪费 的 空间 ， 

Wa FS Ü 4 R 9 
内 容 

这 样 一 来 , AARRE у ха. х. +12. ха+24 和 xa+ 36。 只 点 x 是 4 的 倍数 ， 所 有 的 

XI JF BRE Rn] АЗА Т, 


练习 3.23 

Сы, AXE ЛАВЕ, 35 69 K DLE 1лпихЛАЗ2 下 它 的 对 齐 要求 ， 
А. struct Pl { int i; char c; int J; cher d: }; 

. Struct PZ { int i; char c; char d; int j; ); 

. Struct P3 { short w[3l; char c[3] }: 

. Struct Pd ( short w[3]; char *c[3] }: 

. Struct P3 [ struct Pl a[2]; struct P2 *p }; 


311 综合， 理解 指针 
指针 是 C 语 言 的 一 个 重要 特色 。 它 们 提供 一 种 统一 方式 ， 能 够 远程 访问 数据 结构 。 对 于 编程 新 


170 $3* 


下 来 说 ， 指 针 总 是 会 带 来 很 多 的 困惑 ， 但 是 基本 的 概念 其 实 非常 简单 。 图 326 中 的 代码 说 明了 许多 
这 样 的 概念 。 


1 struct str {  /*Exampie Structure *; 


2 ілі t; 

3 char v; 

4 1; 

5 

6 union uni ( /* Example Union %/ 

fi int t; 

8 char у; 

9 КОМ; 

10 

11 int zg = 15; 

12 

13 void Luntint* xp) 

14 í 

15 void (*f)(int*) = fun; # fisa function pointer */ 
16 

17 ж Allocate structure on stack */ 

18 struct str s = [1,'a']; /* бае structure */ 
19 

20 /* Allocate union from heap */ 

2] union uni *up = (union uni %) mallocísizeofiunion unill; 
22 

23 /* Locally declared array */ 

24 int *ip[2] = ixp, kg); 

25 

26 Цр->у = S.v-«l; 

АТ 

28 printfi"ip = tp, *ip = $p, **ip = ЖАЛП", 
29 ір, *ip, **ip:; 

30 printfi"ip«l = ӛр, 1р[1] = %р, *1р[1] = %d\n", 
31 1р+1, ip[1], *1р[1]); 

32 printf!i"&s.v = &p, s.v = '€$c'sn", &s,.v, 3.v); 
33 printi[lU)Ukup->7 = $p, up-»v = Yc Nn, &up-»v, ир->у}; 
34 prinL£i"£ = %р\п", Ё); 

35 1Ё (--[*xp) > 0} 

36 Ё (xp ] ; Ж Recursive call of fun */ 
37 |] 

38 

39 int testi) 

40 4 

4] int x = 2; 

47 funí&x]: 

43 return x; 

440) 


图 3.25 用 来 说 明 С 中 指针 使 用 的 代码 
在 C 中 ， 指 针 可 以 指向 任何 数据 类 型 ， 
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. 每 个 指针 都 有 “' 个 类 型 。 这 个 类 型 表明 指针 指 问 的 对 象 是 哪 一 类 的 。 ЖИН КӘНІ, 
RRIT ТЕА 一些 指 针 类 于; 


xp.ip[0],ip!lj 





HEX. AR AK D. ЖІПБӘНІҢ ТЕНЖӘ Ж. «fed Ce IR МІН 
ж». Xp. SD Xp 3m T. ЖАРА! sp. КЕНІ void * 羔 型 代表 通用 指针 ， 
11, malo iR [BL — ЕЛМЕН, PRU CRUISER Д КЕНЕН OR 
2120. 

. 每 个 指针 都 有 一 个 值 。 这 个 信 是 其 个 指定 类 卉 的 对 象 的 地 址 。 特 殊 的 NULL (D fica 
带 针 没有 指向 任何 地 方 。 待 会 儿 ， 我 们 会 看 看 我 们 的 指针 的 值 。 

. ”指针 是 用 名 运算 符 亨 建 的 。 这 个 运算 符 可 以 应 用 到 任何 Ivalue 2685 C RERE, ЕЈ 
出 现在 赋值 语 侣 堪 边 的 表达 式 ， 这 样 的 例子 包 所 变量 以 及 结构 、 联 合 和 数组 购 元 素 。 在 我 们 
的 汞 讽 代 码 中 ， 我 们 看 到 这 个 襄 帮 符 应 用 到 全 局 变量 g 上 (第 24 行 )， 应 用 到 结构 无 素 s.v 
| 《第 32 472, 应 用 到 联合 元 素 up->y 上 《第 33 行 ) 以 及 应 用 到 局 部 变量 x F (354247). 

. * 操 作 行 用 丁 指针 的 间接 引用 。 其 绍 困 是 一 个 值 ， 尼 的 美 型 与 该 指针 的 类 型 相关 。 我 们 看 
天 间接 引用 应 用 到 ip 和 *ip E (3862947), 应 用 到 ip[1] 上 第 31 行 )， 以 及 应 用 天 xp 上 
(第 35 行 )。 此 外 ， 表 达 式 up- ov (3347) ВЕНН ор, УЖИН ЈЕ у. 

s 数组 与 指针 是 紧密 联系 的 。 可 以 引用 个 数组 的 名 字 【 但 是 不 能 修改 1， 就 好 像 它 是 一 个 指 
А8 — р. KASA ООН, аз) СИНАН ЗІЛ СЫ, қазу Н 一样 的 效 
采 。 我 们 可 以 在 第 29 行 看 到 这 一 点 ， 我 们 打印 出 数组 ір 的 指针 值 ， 并 用 *ip ЗІЛГЕН- 
J (元素 0)。 

°. 指针 也 可 以 指 回 遇 数 。 这 提供 了 一 个 很 强大 的 存 情 《stofing) 和 传递 代 权 引用 的 功能 ， 送 些 
代码 可 以 被 程序 的 茶 个 其 他 部 分 调用 。 看 看 变量 f (第 15 行 ),， 它 被 声明 为 一 个 措 癌 函数 的 
dé. AARU A int* 作 为 参数 ， 并 返回 void. NA ie E ТАЙЫ fon。 当 在 后 面 我 们 使 
Hf (3641) Bp, 我们 是 在 进行 递归 调用 

给 ORENA: БИЗЕ 

函数 指针 声明 的 语法 对 程序 员 新 手 来 说 是 特别 难以 理解 的 ， 对 于 这 样 一 个 声明 : 

void (*Ё}{1пК*); 

要 从 里 【从 “f” РЭБ) 70, Be, ADES OD” ATARE, EEA. 38. er 
(ин*)” RAAME, v E ЛВ, Aai in bs Ae dk. BE, ADAS ЕД 
一 个 指向 一 个 以 int MES ЗОН 18 0) void d АҚЫН, 

"f 39 65k p t bd. 855m 

void *£f(int*) ， 

xus 


(void *) f(int*); 
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也 就 是 ， 它 会 被 解释 成 一 个 函数 原型 ， 声 明了 一 个 函数 f， 它 以 一 个 int EDS RE EI Л 
void *, 

Kernighan 和 Ritchie (40, 5.12 81928 T— AA ЖЮ C PREMIER M M dU, 

我 们 的 代码 包含 很 多 对 printf 的 调用 ， 打 印 出 -i (HHB p) ЯН. ТТН. “ЕК 
面 这 样 的 输出 ， 


1 ір = ÜxbfffefaB, *ip = ОхЫЬ егей, **ip = 2 ipü]-xp Sp =x=2 

2  lp«l = Oxbfffefac, ір[1] = 0x804955c, *ip[1] = 15 wiil= &g. g = i5 

Jj Ач. = Охей, s.v = 'a' зіп Stack frame 

4  &up-»v = Ox8049760, up-»v = 'Б' up points to area in heap 

5 f = 0х8048424 f points io code for fur 

Б im) = Oxbfffef68, *ip = üxbfffefo4, **ip = 1 ipinnewframe x= 1 

7] 2р+1 = Oxbfffefec, ір(11 = 0х804965с, *ip[1] = 15 ip[l] same as before 

8 &в.у = Üxbfffef?4, s.v = Фа" кпен frame 

3  &up-»v = 2хХ8049770, up-»v = 'b' шр points 10 new area m heap 
їй Í = 0х8С48414 J points io code for fun 


RIES, ICI RHET J PK ЭКЕА test 中 直接 调用 CR. 4217), ME Pk E B] FZ 
的 各 由 调用 (第 36 行 ?。 我 们 可 以 看 出 ， 打 印 出 来 的 指针 值 都 对 应 于 地 址 。 那 些 从 0xbfffef 开始 的 
指针 指向 栈 中 的 你 置 ， 而 其 他 的 是 全 局 存 情 的 一 部 分 【0x80496sSc)， 或 是 品 执 行 代 码 的 -部 分 
(Ux80484]4), EE HE RR COx8049760 ЯП 0x8049770), 

数组 ір 被 初 站 化 7 PAUC—— SEX АН fun А7 0, КАЕ COxbfffefoso 小 于 第 一 :次 
的 但 .Oxbfffefa8), 这 是 因为 栈 基 向 下 增长 的 。 不 过 , SERE POTE SIR kE PERI. 数组 元 素 O Сыр) 
是 一 个 指向 test 栈 帆 中 变量 x 的 指针 ， 元 素 ! 是 一 个 指向 全 局 变量 g 的 指针 。 

我 们 可 DECIES s 也 被 初始 化 了 两 次 , 两 次 都 是 在 贱 中 , 而 变量 up 指向 的 联合 是 在 卉 中 分 配 

жт. “ЕРЕ НН on 的 指针 。 在 反 汇 编 代 码 中 ， 我 们 看 到 如 下 fun 的 初始 化 和 代码 ; 


1 08048414 <£un>: 

2 НП4ВА414: 55 push *ebp 

1 8048415. 89 е5 mov $esp,*ebp 
4 8048417: 83 ec Іс sub 50хіс, Февр 
5 804841а: 57 push tedi 


ПИШ ЖИТТЕ ТЕНЕ 0х8048414 就 是 fun 的 代码 中 第 - :条 指令 的 地 址 。 


ЕСЕН. НЕНІ 

ЖӘНЕ (fide Pascal) ВИНУ Ak it tia А-Қ (by value) 和 引用 【by 
reference ), 40 Ж ТЕЙЛ] ЕЕЗ R Ik. | Л] AGE ЖУК ЕН de. ЕС 
To ЕА АЕ ЕАК, eR BITTER TS XR ЛЕА ido, Aea 
Нн, AMARAT I t kayak. ЖЖ Fun(sx) { 图 326) TRE xp 就 是 这 样 的 、 第 一 
RRA Боп (ах) (35 4217), 给 了 函数 一 个 对 test P PER x SLE, ФХАЯ fun 时， 这 个 
ЕЖ, ДДУ Е, жне. 
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3.12 现实 生活 : 使 用 GDB 调试 器 


GNU B iii ae GDB 提供 了 许多 有 用 的 竺 性 来 文 持 对 机 器 级 程序 的 运行 时 评估 和 分 折 。 我 们 试 
图 几 本 书 中 的 示例 和 统 习 ， 通 过 阅读 代码 ， 来 推断 出 程序 的 行为 。 有 了 GDB, SON SIE 38 116 
积 序 ， 同 时 又 对 程序 的 执行 有 榭 当 的 控制 ， 这 就 使 得 研究 程序 的 行为 才 为 可 能 ， 

图 3.27 给 出 了 5 GDB 命令 的 例子 ,在 使 用 机 器 级 32 程序 时 ,会 有 所 玫 有 同 , 先 运行 QBJDUMP 
来 装 得 程序 的 反 汇 编 版 本 ,是 很 有 好 处 的 。 我 们 的 示例 都 是 基于 对 交 件 prog 运行 СОВ 的 ， 程 序 的 
{ЖАП БЫЛ ARABES ПО 页 。 我 们 月 下 面 的 命令 行 来 日 动 GDB: 

unix» gdb prog 

ЕНЕ ИЕЛЕ M Ji ШЕЕ. ВЦ B EPS SN АП. REHE 
让 一 个 程序 的 地 址 处 。 在 程序 执行 过 程 中 , АҢ-ФНАЫНМ, ЖЛЕ Р, ЛЖНЧЕШ ЖИЕ ҮН)! 
任 断 点 处 ， 我 们 能 够 以 各 种 方式 可 看 各 个 寄存 器 和 存储 器 位 置 。 我 们 也 可 以 单 步 跟踪 程序 ， 一 次 只 


质 行 几 条 指令 ， 或 是 前 进 到 下 一 个 断 点 。 
命令 
Жы 
quit 
run 
kill 
Wi xs 
break sum 
break %0)хХ80481с:3 
delete 1 
delere 
执行 
steni 
stepi 4 
Hext l 
continue 
finish 
检查 代码 
disas 
dlisas sum 
disas Ox80483D7 
disas UÜx80482b7 0х80483с7 
print /x Seip 
检查 数据 
print Seax 
print /х $еах 
print /t 5вах 
print Фх100 
print /x 555 
print /х ‘Ѕерр+8) 


效果 


Exit GDB 


Run your program (give command line arguments here) 


Stop your program 


Set breakpoint at entry to function sum 
Set breakpoint at address 0х80483с3 
Delete breakpoint 1 

Delete all breakpoints 


Execute опе instruction 

Execute four instructions 

Like stepi, but proceed through function calls 
Resume execubion 

Run until current function returns 


Disassemble current function 

Disassemble function sum 

Disassemble function around address OxB0483b7 
Disassemble code within speci.ed address range 
Print program counter in hex 


Print contents of %eax in decimal 
Print contents of "beax in hex 

Print contents of %eax in binary 
Print decimal representation of 0x 100 
Print hex representation of 555 

Print contents of %ebp plus 8 in hex 
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print *(Int *) ВхҺЕРЕЕЙ9О 
print *í(int *) (Sebp-+8) 
xX/aw Üxbiffrs9U 


x/2üb sum 
HHI B 

info frame 

info registers 

Hep 
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Print integer at address ÜxbfIfT890 
Print integer at address %ebp + 5 


Examine two (4-byte) words starting 


Oxb-ffff890 
Examine .rst 20 bytes of function sum 


Information about current stack frame 
Values of all the registers 
Get information about СОВ 


图 3.27 СОВ vbi 


xt Fe pi RED r JF GDB 支持 机 器 级 程序 调试 的 为 式 。 


at address 


下 入 我们 的 示例 表明 的 那样 ，GDB К А АТЕНЕ, Не ЗИНА 用 GDB 的 


help 90° H1) 能 郊 服 这 些 毛病 。 


3.13 ”和 存 铺 露 的 越界 引用 和 缓冲 区 溢出 
我 们 已 经 看 到 ，C 对 于 数组 引用 不 进行 任何 边界 检 含 ， 而 屿 局 部 变量 和 状态 信息 〈 例 如 寄存 器 


HARPES 部 存放 在 栈 中 。 这 册 种 情况 结合 到 一 起 就 能 导致 严重 的 程序 错误 ， 


-个 对 越界 的 数 


组 元 素 的 写 操作 破坏 了 存储 在 栈 中 的 状态 信息 。 然 后 ， 当 程序 使 用 这 个 被 破坏 的 状态 ， 试 图 重新 加 
载 寄 行 占 战 执行 ret 指令 时 ， 就 会 出 现 很 严重 的 错误 。 

一 利 笠 别 杀 见 遇 状态 破坏 称 为 组 证 区 洲 出 《buffer overflow). AA, ВАЕ TT 节 数 组 来 
保存 一 个 字符 串 , 但 是 学 符 串 的 长 度 超出 了 为 数组 分 配 的 空间 ,下 芽 这 个 程序 示例 就 说 明了 这 个 问题 : 


char *gets(char *=) 
{ 

int c; 

char *dest = s; 


*dest++ = с; 
ii le == EOF) 


return NULL: 
return a; 


= — uou J oc Vr Jg 3 Lh -? 
с 


m 


J 


12 у 


ld  Кеадіпрш line and write it back */ 


15 void echoi) 


while (іс = getcharí)) 


/* Implementation of library function gets() #7 


l= "Ап" && c іс EOF] 


*destrr = 'i0'; /* Terminate String %/ 


15 [ 
17 char buf[4]; /* Way too small! */ 
18 get atout); 


19 puksiouf): 
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2000) 


Bi fase iH / — 4 BE gets МІЗ, НЖИННА BRE HO PE А. к.А АЛЕ À 
—1p, ЯЈВ —^ "An" PERRA RARE. LOS УРТ АЕШЕ ЕЕ ЖУ, 
ЖЕН esa r ЛЫП E null EE. ЖЖЖ echo 中 ， 我 们 使 用 了 gets， 这 个 函数 只 是 简单 地 从 标准 输入 
HRA. BERE. 

gets Jj BUR E S AMARE EM PECES АС Т ЖӘШІКТІҢ ERIE есһо н, 
我 们 故意 将 缓冲 区 设 得 非常 小 -一 -只 有 隔 字 节 长 .任何 长 度 超 过 3 个 字符 的 字符 串 都 会 导致 写 越界 。 

研究 echo 汇编 代码 的 这 一 部 分 ， 看 看 栈 是 如 何 组 织 的 ; 





| echo: 

2 pushl &ebp Save %ebp on stack 

3 movl €esp,$ebp 

4 supl 520,%евр Ailocate space on siack 

5 pushl Жерх Save #ерх 

6 addl 5-12, %еѕр Ailocate more space оп stack 
7 leal -4(S$ebp),tebx Compute buf as Фебр-4 

8 pushl ЖеБх Push buf on stack 

9 call gets Call gets 


在 这 个 例子 中 ， 我 们 可 以 看 和 到， 程序 总 共 为 局 部 存储 《storage) 分 配 了 32 个 字 节 【第 4 fT RISE 
6 110. 不 过 , 字符 数组 buf 的 位 置 企 ebp 下 方 四 个 字 节 处 【第 了 行 )。 图 3.28 给 出 了 得 到 的 栈 结构 。 
正 胡 看 到 的 那样 ， 所 有 对 bufl41~buff71 的 写 都 会 导致 %ebp 的 保存 值 被 硕 坏 。 当 程序 随后 试图 以 全 
为 栈 指 针 进 行 恢复 时 ， 所 有 后 来 的 栈 引 用 都 会 是 非法 的 。 所 有 对 buf[S] - buf[11]i] 5 2 ОБ А 
地 址 被 玻 坏 ， 当 在 函数 结尾 执行 e 指令 时 ， 程 序 会 “返回 ”到 错误 的 地 址 。 像 这 个 示例 说 明 的 那 
ff. НАНЫН ЕН ЕНЕҢ БР ИННА. 






WHE 
Ш> 
— 
mo 
echo 
Ті 


图 3.28 echo 函数 的 栈 组 织 
TERA buf ИЕН 上面 ， 对 buf НАЙ REEL FEE КДК Ж. 


БӨЛІМ echo 代码 很 简单 ， 但 是 有 点 太 随 意 了 。 更 好 一 点 的 版 本 是 使 用 fgets ӨШ, CARA 
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一 个 参数 ， 限 制 符 读 入 的 最 人 字 节 数 。 家 庭 作 业 337 ЖАНЫН. ШИ h tS ЕНЕ ЛА ЕНЕ 
echo ӘЖ, Жл. СЕН gets 或 共 他 能 导致 存储 溢出 的 函数 ， 都 是 不 好 的 编程 习惯 。 当 网 详 一 个 含有 
VIF] gets ПО УЙГЕ. C 编译 器 甚至 会 产生 这 样 的 出 错 信 息 :“ 由 e gets function is dangerous and should 
not be used (ges ЖОЛҒА, АЛИН.” 


code/qsm/bufovi.c 
1 {* This is very low quality code. 
2 It is intended to illustrate bad programming practices. 
3 Set Practice Problem 3.24. %/ 
4 char *getiinei!) 
2 l 
6 char buf[8]; 
7 char *result; 
d десу {һиЁ); 
9 result = malloc'strlen(but)); 
10 stropy (result, buf); 
11 return(result); 
Із) 
code/asm/hujovf.c 
C 代码 
1 18048524 «zqgetline»: 
2 8048524: 55 push %ерр 
3 8048525: 89 е5 mov Жезр,Ферр 
4 8048527: 83 ec 10 sub 50Х10,%евр 
5 8048522: 56 push *esi 
6 H04852b: 53 push ебх 
Diagram stack at this point 
l 804852c: 83 c4 f4 add 5ОхЕТІНІІҒА, esp 
8 80483521: За 5а ға lea ОхЁҒҒЁҒҒҒЁ8 (ebp), ерх 
9 8048532: 53 push %ерх 
10 8В048533: её 74 fe ff ff call 80483ac <_1л1С+0)0х50> gets 
Modify diagram io show values at this point 
对 gets VAR BS RTL 9н 
图 3.29 练习 题 3.24 的 已 和 反 汇 编 代码 
练习 题 3.24 


图 3.29 给 出 了 一 个 函数 的 【 不 太 好 的 ) 实现 ， 这 个 男 数 从 标准 输入 读 和 一行， 将 字符 素 措 贝 到 
新 分 配 的 存储 ， 并 返回 一 个 指向 结果 的 指针 ， 

考 谋 下 面 这 样 的 场景 ;过程 getline 被 调用 ,返回 地 址 等 于 0808643, 寄存 器 ebp 等 于 Dxbffffe94， 
ЖАР %ен ЯУ 0х1, 84-8 Ете 等 于 0x2， 输 入 字符 囊 为 “012345678901". 程序 会 因为 段 错误 
( segmentation fault) 而 中 止 。 运行 GDB， 确 定 出 错误 是 在 执行 getline 的 ret 指令 时 发 生 的 ， 

A. 填写 下 图 ,说 出 尽 辟 能 多 的 关于 在 执行 完 反 江 编 代码 中 第 得 行 指 今后 槛 的 信息 。 在 右边 标注 
出 奇 储 在 栈 中 的 数字 的 意思 【例如 ,“ 有 返回 地 址 ? )， 在 方 框 中 写 出 它们 的 十 关 进 制 值 。 8-2 E Ru 
支 4 个 字 节 。 另 外， 还 需 指出 名 ebp 的 位 置 ， 
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iz |a] Hh nt 





B. 修改 你 的 图 ， 以 展现 调用 pers 的 影响 (第 10 47). 

C. 程序 应 该 试图 衣 回 到 什么 地 址 ? 

D. 当 getline 返 国 时 ， 哪 个 【 些 ) 寄存 器 被 破坏 了 ? 

E. 涂 了 可 能 会 缓冲 区 溢出 以 外 ，getline 的 代码 还 有 哪 两 个 错误 ? 


缓 神 区 游 出 的 -个 更 加 致命 的 使 用 就 是 让 程序 执行 它 本 来 不 愿意 执行 的 函数 。 这 是 一 种 最 常见 
的 通过 计算 机 网 络 攻击 系统 安全 的 方法 。 通 常 ， 输 入 给 程序 一 个 字符 串 ， 这 个 字符 串 包 人 党 一 些 可 扫 
行 做 码 的 字 节 编码 ， 称 为 exploit cede， 另 外 ， 还 有 一 些 字 节 会 用 一 个 指向 组 冲 区 中 那些 可 执行 代码 
ЧЕГЕ BOR. ЖИ, BAT ret 指令 的 效果 就 是 跳 转 到 exploit code. 

在 -- 种 攻击 形式 中 ，exploit code 会 使 用 系统 调用 启动 一 个 shell БР, ЖОБА Е 
ЖИН. 在 另 -- 种 攻击 形式 中 ，exploit code Т ЖЕНЕ, БАЛЫН. ЖЕЖ 
二 次 执行 ret 指令 ，( 看 上 去 好 像 ) 正常 返回 给 调用 者 。 

让 我 们 来 看 -个 例子 , 著名 的 Internet 蠕虫 病毒 在 1988 年 11. 月 通过 Internet 以 四 种 不 同 的 方法 获 
取 对 主 多 计算 机 的 访问 。 一 种 是 对 finger 守护 进程 fingerd ИЕЛ PCS Hi Wik, fingerd 是 通过 FINGER 
命令 来 服务 请 求 的 。 通 过 以 一 个 适当 骸 字 符 串 调用 FINGER， 蠕 虫 可 以 使 远程 的 守护 进程 缓冲 区 浇 出 
并 执行 一 段 代 码 ， 读 代码 能 让 蠕虫 访问 远程 系统 。 一 旦 蠕虫 束 得 了 对 系统 的 访问 ， 它 就 能 自我 复制 ， 
几 巴 完全 地 滑 耗 掉 机 器 上 所 有 的 计算 资源 。 因 此 ， 在 安全 专家 抓 件 如 何 滑 除 这 种 晴 囊 的 方法 之 前 ， 成 
百 上 干 的 机 器 实 际 凸 者 次 奖 了 。 这 种 蠕虫 的 始作俑者 最 后 被 抓 住 并 被 起 许 。 他 被 判处 三 年 徒刑 ( 独 期 
执行 )、400 个 小 时 的 社区 服务 以 及 10500 美元 的 罚款 。 不 过 ， 即 使 天 令 天 ， 人 们 还 是 在 不 断 地 发 现 佳 
他 们 容易 王 受 缓 溃 区 洲 出 攻击 的 系统 安全 漏 酒 ， 这 更 加 突显 了 小 心 仔 细 编 写 程序 的 必要 性 。 住 何 到 相 
部 环境 的 接口 都 应 该 是 “ 防 痢 的 ”， 这 样 ， 外 部 agent 的 行为 才 不 会 导致 系统 出 现 错误 ， 


ж; ЫЕ i 

LET АША E NAI SK CES. Же ijui b Mx 
(worm) JE E — HK, TA É GER, АВОН Е НКЕ. Б 
此 相应 地 ， 病 毒 (vins) £#ik W — RA, ЕЕНАСБМН ede MERE A GREEFF, Te 
它 不 能 独立 运行 。 Ж-ЕХАНАФ. Kë "Ad ЛАЗ ЖЕН 06 RRR Е Клан 
5, ГТ АЛЕ КЖ ИЧИ “Ж” W £ 64k T "Ad. 


在家 庭 作业 3.38 中 ， 你 可 以 获得 准备 缓冲 区 溢出 攻击 的 第 一 手 经 验 。 注意 ， 我 们 不 能 原谅 任何 
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用 这 种 或 其 他 任何 方法 来 获得 对 系统 的 未 被 授权 的 访问 。 未 经 许可 闻 入 计算 机 系统 与 闻 入 МЕЗ 
是 一 笠 的 一 一 是 一 和 犯罪 行为 ， 即便 犯罪 者 并 没有 赣 意 。 我 们 给 出 这 样 一 个 作业 有 两 个 原因 ， B 
它 素 求 对 机 器 语言 编程 有 很 深 的 了 解 ， 将 许多 问题 结合 Л, ВИТАЯ ЎА. УЕ ТАСЛАР ЗВ 
编码 。 其 次 ， 通 过 讲解 缓冲 区 涂 出 攻 硬 是 如 和 何 进 行 的， 我 们 希望 你 能 了 解 到 编写 不 允许 这 种 站 市 的 


Si. DT DOR S Microsoft 作战 

АЖ 1999 年 7 月 , Microsoft 提出 了 一 种 即时 消息 (TM ) 系统 , 其 客户 端 与 流行 的 美国 在 线 ( AQL ) 
的 IM 服务 器 兼容 这 就 使 得 Microsoft 的 IM A P T AP AOL 的 JIM 用 户 聊天 .不 过 ， 一 个 月 后 ， 
Microsoft 的 IM 用 户 突然 神秘 他 不 能 与 AOL 的 IM JH P X Т. Microsoft Ah T 3 Ari РО, W 
复 了 对 AOL IM 条 统 的 服务 , 但 是 几 天 之 内 ,这些 客 户 端 也 只 不 能 工作 了 ,尽管 Microsoft 版 本 的 客 
ЛИЯ WOES AOL IM 的 协议 , ЖАРЕ Z3, AOL 就 是 能 够 确定 一 个 用 户 是 否 运 行 的 是 AOL 
版 本 的 IM ЖР. 

АСЕР ЯКЕИ ЗИТ АША. 这 很 可 能 是 AOL КФ ЛЕНЫ АЁ", 
AOL fi B CARP М АЧЫ. ALAS P RE КАЕР” Ж. ЖЖ ИКТ Ж. AOL 的 exploit 
code А Р ЖЕ 5d & XU YA, ЖЕТА - MS, Eu E. + 
ЖЕБЕНИН, ЖЖ ЖА 6,59 9 AOL ЖР “АЯ” ХАН, ЖАЛ 
务 器 就 会 假定 这 个 客户 端 不 是 AOL RP. ЕЮ ЕНИ, MA, ЖК ЮМ 客户 端 ， 例 各 
Microsoft ЖЕР, ЖЫН АО, 的 IM 服务器， 他 们 不 仅 要 加 入 ЛО. K P 2 P dk t н 
Hk, ВЕ M 345 D. ЖЕ ФЕ Қат, S. -- Ндир 
位 置 相 匹配 了 ， 娃 他 们 新 的 客 产 庙 程 序 向 用 户 分 发 了 ，AGQOE UE M Ob BCC ih exploit code, 取出 
ЖРТВЕ РАВЕНА. RRE, 52-8 AOL 客户 端 永远 也 不 可 能 赢 的 战争 ! 

ЖАНЕ ага, ЖТР ННД АО FUSE REB FECE EIER, EKA 
3.2 Phil Bucking £j 3k 5 3I, 934 £ M 3 Ж Richard Smith Ж Т РӘ РӘ, НЕ 
THARE. Smith ТТ Е, АНАНЫҢ ERE EU. Microsoft 内 部 改 出 的 ,后 来 Microsoft 
AGO WC UE RUE T kW SISI], ОЛЕНА 5—7. АО АЧА АН, 48, 
不 永 认 他 和 们 利用 这 个 错误 ， 即 使 是 在 澳大利亚 的 Geoff Chapel] 4b dr Ez TEE. 

那么 ， 在 这 个 事件 中 ， 谁 违反 了 哪些 行为 规范 呢 КА. АО 没有 义务 向 非 AOL 客户 端 开发 
ES, IM 系统 ， 所 以 他 们 阻 上 Microsoft XE 80, £ —J3r 5$, ӨЛЯЖЕ НАНЫН ҰН, 
一 个 很 小 的 错误 可 能 就 会 寻 效 客户 端 计算 狼 明 质 ， 而 县 官司 得 系统 更 客 易 遭 受 外 部 主体 的 臣 击 【 骂 
NACE EAE Xo CLR А ТІНЕН), Microsoft 将 AOL KERMA ТР BUE НАР TA. 
不 过 ， 用 РЫ Bucking АНИК, АЛАҢНАН, ЛАСА š 6 f k 
АЖ. Edu AM. —C 


3.14 “ 浮 点 代码 


ЕЗ ЕНЕН A EE AN 体系 结构 最 不 优美 的 特性 之 一 。 在 最 早 的 Intel 机 器 中 ， 浮 点 是 由 
一 个 独立 的 协 处 理 器 来 完成 的 ， 这 个 部 件 有 它 自 己 的 害 存 器 和 处 理 能 力 ， 能 够 执行 一 部 分 指令 。 这 
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个 协 处 理 器 是 由 名 为 8087 80287 811387 的 独立 世 片 实现 的 ， 肌 伴随 者 处 理 路 心 片 8086、80286 和 
i1386。 在 这 些 产 品 的 开发 过 程 中 ， 意 片 的 容量 已 经 不 是 以 在 一 鼎 基 片上 茎 包括 证 处 理 器 六 包 括 浮 点 
协 处 理 器 的 。 另 外 ， 廉 价 的 机 器 会 省 去 浮 点 硬件 ， 只 用 软件 来 完成 浮 点 操作 (非常 惕 1 从 1486 F 
治 ， 溯 点 就 作为 IA32 CPU 芯片 的 一 部 分 了 。 

1980 “E, 最 早 的 8087 АЗЕ SET je ЇЇ ЖЧ Y iB ar. БЕЯ- FA AEA, BA СЕРІ), 
同时 也 基 IEEE А АЈ ЕВА. РЕХАН ЈЕ ТН, ТЕЗЕ КЕЕ ЕҢ ЕЕ a JR А, ЕРІ) 会 接 
过 它们 完成 执行 。FPU ЕКА ЗЕ BE 1b REB ERR. ВИВА-ЯН ЕЙ B 
Ж МЕ y hb Pas STAS. ВЕ ЛАРЕ АЕ ШЛА ҒТА. HAAA 1А32 I B Eb 
EIXE BEL. Я?Ь 1980 ТАНА KB ЙЕ. ЖЕН ТЕН і. [A32 2 
点 的 许多 特性 都 是 很 准 的 日 标 。 


3141 浮 点 寡 存 器 

学 点 单元 包 拓 8 个 学 总 寄存 器 ， 但 是 和 普通 寄存 器 不 -- 样 ， 这 些 寄存 器 是 被 当成 一 个 浅 栈 
(shallow stack) ЖЕН. X mr £r АЕ Rb UL 96st(0). 901), SESE, А9507), Е, %50) 
ТЕҢ. ЖАТА УН, МЕНЫН ӘҢ Ж. 

K333LAJTRS A аг Шана. ПЕМ ВЕРЕН ВИТЕ, ИНЕШ. HOMES. 
KART. (20168170455, RA ACEA ЖЕР ЕНІМДІ, u t 了 一 种 简单 的 对 算 
术 指 令 求 值 的 机 制 ， 同 时 它们 也 多 许 指令 的 密集 编码 《dense coding)。 随 者 编译 技术 的 进步 ， 同 时 ， 
指令 编码 所 需要 的 存储 器 出 不 再 是 很 关键 的 资源 ， 这 些 属性 就 不 情 重 要 了 。 写 费 译 器 附 人 会 更 贤 兴 
和 一 组 更 大 的 、 健 用 方便 的 浮 点 寄存 器 。 


Ен. ЖТЫН 
ТАЯНА GU ЕВЕ ДИННЕ НЕ Lake zr e qr k r. Xe DH 
FLOR Т P 8,45 Java 3 AUS. Java 编译 器 产生 的 中 间 格 或 .以 及 PostSaript 页 面 格式 北 语 言 ， 


ҢЫЗ ERIT TUR ЛЕШ. {НИК ЫЕ ЖЕН o ay tr КЕД МОН RE FEST 
程 的 局部 变量 。 对 于 局 部 变量 的 存放 ,我 们 已 经 看 到 ， 有 些 通用 寄存 器 可 以 被 指定 为 由 被 调用 者 保存 ， 
因此 ， 可 以 用 来 保存 鉴 过 程 调 用 的 局 部 变量 。 这 种 指定 对 [A32 浮 点 寄存 器 来 说 是 不 可 能 的 ， 因 为 它 
的 标 襄 随 月 值 计 入 栈 中 和 从 栈 中 弹出 是 变化 的 。 一 个 上 讨 栈 操作 会 使 名 stt0 中 的 值 现在 在 部 sf 和 中 ， 

月 一 方面 ， 生 会 将 祥 点 寡 仔 如 作为 真正 的 栈 来 对待， 每 次 过 程 调 用 时 ， 都 将 本 地 值 压 人 其 中 。 
DERT BUSH. AARAA 个 值 的 位 置 。 作 为 代替 ， 编 详 器 产生 的 代 否 会 在 
调用 另 一 个 过 程 2 前 ， 将 每 个 本 地 淹 点 值 都 压 入 到 主 穆 序 栈 中 ， 然 后 在 返回 寻 把 它们 取出 来 这 样 
J 起 的 存 展 器 访问 操作 会 降低 程序 的 性 能 。 

像 24.6 节 中 说 明 的 那样 ，IA32 浮 点 寄存 器 的 宽 都 是 ВО 位 。 它 们 以 家 庭 作 业 258 中 描述 的 扩 
忆 精 度 格 式 来 对 数字 编码 。 当 从 存 情 器 加 载 到 浮 点 害 存 器 时， 所 有 的 单 精度 和 双 精 度数 都 转换 成 这 
种 格式 。 运 算 总 是 以 扩展 精度 格式 执行 的 。 当 存 回 存储 器 中 时 ， 数 字 会 从 扩展 精度 转换 成 单 精度 或 
双 精 度 格 式 。 


3.142 栈 的 表达 式 求 值 
为 了 理解 1A32 是 如 何 用 它 的 浮 点 寄 帮 器 作为 栈 的 ， 泪 我 们 来 看 看 基于 栈 来 求 什 的 一 个 更 加 抽 
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ANRE., BREIS МЯК, HK KI teri B ЕЖ, Ei EBE 3.30 所 未。 比如 说 ， 
SIRRI RPN (Reverse Polish Netation, 352 ^ cR AAi ИЛЕ ГАР ҮТЕ. ОРА. 

МУН — Tn ARGENTA RITH eo S НОХУН, ша. bH x ШІК 3.30 表明 的 ， 
我 们 能 够 用 load 指令 将 存 情 器 征讨 入 这 个 栈 中 。storep 操作 弹出 酰 顶 元素 ， 并 将 结果 有 放 划 存储 器 
H. PRERE. В пер ЖБ), ТЛ ТЕЕ Н, НА В Г. Е 
作 数 的 操作 ， 例 如 адар 和 multp, АЛЛЕ. ЕЛЕНА S Н. Е 
果 盯 同 栈 中 。 我 们 在 存 翌 、 加 法 、 减 法 ， 乘 法 和 除法 指令 后 下 加 上 后 缀 “p"， 是 为 了 强 斤 这 些 指 令 
弹出 了 它们 的 烙 和 作 数 。 


оаа 5 ң НАҚ АҢ 
ztorep D ao gU TR u E F Fat D 处 
neg Кл 


адар Нл Ж: 上 庄 入 它们 的 和 
Бирр ИУ РЕЛ: ІКАЕНІНЕ 
титр ВЕ л, ЖАЕТІНЕ 
а1ур Surg TEILE: 上 大 它们 的 比值 


图 3.30 假设 的 栈 指 邻 集 





ҚНЖЕ T ТЕ аер ЖЕН. 


作为 一 个 小 例 ， 考 虑 表达 式 x-(a-b)/ (-b+c), 我 们 可 以 将 这 个 表达 式 翻 详 成 下 血 的 兴 码 ， 在 每 
人行 代 但 兽 进 ， 部 给 出 了 浮 扣 寄存 器 栈 的 内 容 ， 为 了 与 我 们 前 面 扔 枝 例 保持 一致 ， 我 们 画 的 栈 是 癌 
ТЭИ, ВТО ПЗЕ р де ЕЛЕК. 


| tade Таар 6 load а ise 


| 1 b wut (l) 
қаралы | 
load ú r а ill a stit] 
| b | жаг [D| 
т sube 
Www Tt gti]; 
пец | c 1 stil) u -h +51 (0) 
| -b *sb rU] 
a divp | FhMC-h--c | ЖЕК (ü) 
1 addp -由 一 1 вт (U) : — — i 
5 storep x 
| P | sst (D) 


ЖРК ЕРІГЕН, EM PRSE ЗА НН E -ARRAI PU 
т UAE Ж КА, ПЖ FORBES ЕЛІ, 

l. 格式 为 Yar 的 变量 引用 。 是 用 指令 load Var 来 实现 的 。 

2. 格式 为 -Expr 的 音 操 作 数 操作 ,这 是 用 先 产 生 Expr 的 代 反 ,然后 再 跟 一 -条 neg 指令 来 实现 的 。 

3. 格式 为 Expr + Expr, Expr,-Expr,. Expr * Expr, EÉ Expri / Expr 的 双 操 作 数 操作 。 安 的 实 
WEE Бхр, HESS, Ж Exp 的 代码 ， 然 后 是 一 条 addp、subp、maltp 或 divp 指令 ， 

4. ЖД Var = Expr 的 赋值 宫 作 。 这 是 通过 先 产 生 Expr 的 代码 ， 然 后 跟 一 条 storep Var 指令 来 
SC BEES. 
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作为 一 个 示例 ， 看 看 这 样 一 个 表达 式 x=&-bic。 因 为 除法 的 优先 级 高 于 减法 ， 这 个 表达 式 加 
ЕЛМЕН x-a-(b/c) 六 此 递归 过 程 会 像 这 样 进行 : 
l. КЕ Ехрг-а-(Б/с) ТҮ. 
(а) = Exp 2 b/e 的 代码 ， 
ji. 用 指令 load c 产生 Expr; = c 的 代码 。 
i. ДИҢ” load b 产生 Expri = p 的 代码 。 
ii. 产生 指令 Шур. 
(b) 用 指令 load a 产生 Expr = а ЖИК. 
(с) 产生 指令 зир. 
2. 产 咎 指令 storep x. 
整体 效果 就 是 产生 下 面 这 样 的 栈 代 个 ， 


DE 
1 мае | c | 4ссі0) 4 nad a bic &still 
ЖБ ГО} 
2 load b C | Ф511) 
h ist Q) 5 subp | a — (bic) [ satio) 
3 divp hje &sr (0) 5 prorep x 
ЗІҢ 3.25 


产生 表达 式 x = a*b/c * - (ао АА, S 8-0 ш ЕЕ EX, Got Em ced xu 
Яо FT [E 38. 0 


SRE S URGERE ES RFI, BOKI EIS ЕЛ УЛ Т. ЖШ, GIB ISTERI i х = 
(a*by*(-(a*b)«c). ЖЯ. 效率， 我 们 柜上 只 计算 a*b 一 次 ， 但 是 我 们 的 栈 指 令 不 提供 一 种 方式 将 值 你 存 
ERF. ПА НЕН. ЕШ, 使 用 图 330 中 询 出 的 这 样 一 组 指令 ,我们 会 需要 将 中 间 结 末 atb 
仓储 在 存储 器 中 其 个 位 置 ， 比 如 说 5 每 次 要 使 用 时 就 取出 这 个 值 。 得 到 下 面 这 样 的 代码 ; 

} loic T ce ама т тез — st (1) 

2 load Б ЕЗ st —iz-b %3- (Ü) 

E—— WS з adap Тате Газ) 

% load a | с | sti21 9 loadt &st (1) 

| Ë stil} | «b 96000) 
j ü | wat (0) 


10  muitp gb. {а B) c) 


wa. 0) 
_ ab | *st(0) P 


һ load t с. аа (1) 


а b %st (Q) 


RR BW ЛЕЙДІ Y URBS eae vh RAE, ЕЕЕ ЕНЕР ТЕ ЇН) 
结果 时 。JA32 浮 扣 单元 避免 了 这 种 低 效 率 ， 引 入 了 算术 指令 的 变种 ， 将 它们 的 第 二 个 操作 数 留 在 栈 
中 ， 可 以 用 任意 栈 值 作为 它们 的 第 二 个 撞 作 数 。 另 外 ， 它 还 提供 一 条 指令 ， 可 以 将 栈 顶 元 素 与 任何 
其 他 元 素 进行 交换 。 虽 然 这 些 扩展 可 以 用 来 产生 更 有 效 的 代码 ， 但 是 将 算术 表达 式 翻 译 成 栈 代码 的 
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简单 向 优 关 的 算法 丢失 了 。 


3143 浮 点 数据 的 传送 和 转换 操作 

几 记 符 镶 stti) 来 引用 译 点 寄存 器 ， 这 里 1 代表 相对 于 栈 顶 的 位 置 。 值 i 的 范围 为 0 一 7。 寄 企 器 
PERITA., PWDE A, REŽE. EUH s 来 引用 栈 项 元 素 。 当 一 个 新 值 未 入 栈 
中 时 ， 寄 站 器 锡 stf7) 中 的 值 就 亚 拓 了。 当 从 栈 中 弹出 时 ， 锡 st 7 中 的 新 值 是 不 可 蚤 测 的 。 编 详 器 产生 
的 代 志 必须 能 在 寄存 回 栈 青 限 的 容量 中 工作 ， 

ІН 3.31 给 出 的 指令 集 吓 用 来 将 值 压 入 浮 点 寄存 器 栈 中 的 。 第 一 组 指令 从 存储 占 位 置 中 读 ， 这 时 
2 Addr EEH esc E. CRER 33 中 列 出 的 某 种 存储 器 操作 数 格 式 委 出 。 这些 指 令 是 以 假定 的 
源 操 作 数 的 格式 来 区 分 的 ， 因 此 任 须 从 有 储 嚣 中 该 出 一 组 季节 。 回 忆 下 符号 МАЈ, Ж ЖАМ 
始 地 址 为 Addr 的 b 个 宝 节 的 访问 。 在 将 井 作 数 此 六 栈 中 之 前 ， 所 有 这 些 指 令 都 会 将 它 转 换 成 扩展 
FE д. datis S Па 用 来 复制 - -个 栈 的 值 ， 也 就 是 ， 它 将 浮 点 寄存 器 Bst( 的 ”个 副本 讨 
入 栈 中 。 例 如 ， 指 念 fid 名 st(0) 将 栈 硕 元 素 的 ЕЖ АВ. 


flcs Ma[Addr] 
Eld! Мы Addr] 


Fldt Афаг " | МА] 
fil&l Аа Ma[Addr] 





85331 浮 点 加 载 指令 
ЭТТЕ УЕН EN ЮНГ ҢЕЛ. PULBO M SEU, 


Fi 3321 Шш Y PLIRIN Ж Ib Ee PR US FR A S fra РИНЕ AR. “ЯҢ” AATRE, 
一 种 是 将 栈 硕 元 素 弹出 栈 CRIBUTUT BU ВЕ ЖЯ ВЕСЕ BS өшер 指令 )， 一 种 是 非 弹 出 版 本 , ЖОВ 
但 留 在 栈 硕 上 。 同 浮 点 加 载 指 今 一 拌 ， 指 令 的 不 同 变种 产生 的 结果 格式 也 不 同 ， 因 而 会 存储 不 同类 
日 的 学 节 。 第 一 组 指令 是 将 结果 存 到 存储 器 中 。 地 址 是 用 图 3.3 中 列 出 的 存 信 器 操作 数 格式 中 的 某 
一 种 指定 的 。 第 一 纽 指 令 是 将 栈 顶 元 素 拷 贝 到 另外 一 个 浮 捉 寄存 器 中 。 


Ma[Addr] 
MalAddrl 
Мы Ааа) 
MalAddr| 


fstt Addr МшАйағ| 
fstpt Addr Mil Adr] 
fistl Addr MalAddr] 
fistpl Addr ; M.[A dr] 
fst stii) 





fstp stii) 


图 3.32 浮 点 存储 指令 
所 有 的 指令 将 站 果 从 扩展 精度 招式 转换 成 日 标 格式 。 芝 后 纹 “p” КВАНТИ ЖИН В. 
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练习 题 3.26 


为 下 面 这 段 代码 做 如 工 假设 ， 寄 存 器 %eax 包含 整数 变量 x， 而 栈 俐 两 个 元 素 分 别 对 应 于 变量 а 
和 bb， 在 方 框 中 写 出 每 条 指令 后 栈 的 内 容 ， 


test] %еах,%еахк 


200 т ТН мо 
а) өне 


4 jmp 1.9 
5 111: 
7 19; 


写 出 一 个 用 x， аът СААХ, WH RGB 55 k 2 5. МИЛА. 


ЖАНУЫ a rd ТЕЛЕК E ЖУРУ И PA ЗҮН ЕНУ Л. O fxch tst AGE AW 
ЗО ФЕН. ЛЕ Е fxch 等 价 于 fxch ws CRE, ТЕРБЕП Л.Ж. 


3144 浮 点 算术 指令 

图 3.33 说 明了 一 些 最 常见 的 浮 点 算术 操作 。 第 一 组 中 的 指令 没有 操作 数 。 它 们 将 菜 些 常数 数学 
В ТАВ, Жл. е 和 logs10 这 样 的 常数 ， 也 有 类 似 的 指令 .第 二 组 中 的 指令 有 -TH 
作 数 。 这 个 操作 数 总 是 栈 质 的 元 素 ， 类 羽 于 假设 的 栈 求 值 器 中 的 neg 把 作 ， 它 们 会 用 计算 出 的 值 到 
代 这 个 元 素 。 第 三 组 中 的 指令 有 两 个 操作 数 。 对 每 个 这 样 的 指令 ， 都 有 关于 如 何 指定 操作 数 的 许多 
PEREA, бр ДЕ. ТАРА Ы, БІЛІМНЕН, НИП (ЮП fsub) 和 反问 〈 例 
如 fsubr) AARRE, Жр н) В р ЕМИР В Е S NN. 


ён Әр; 
Opi- Өр 
Op- Ор 
Op / Ор; 
Op: Hp 
Om - On 





图 3.33 浮 点 算术 操作 
ПРОВЕРЕ НЕН Е EB, 


在 图 3.33 т, ПА Н ГЕНЧЕ fub 的 一 种 形式 。 实 际 上 ， 这 个 操作 有 多 个 变种 ， 如 图 
3.34 Br», ХЕДА НЧЕ 2 E. Ор - Op:， 并 将 结果 存放 到 其 个 浮 点 客 存 器 中 ， 除 
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了 为 假设 的 栈 炒 值 器 考虑 的 简单 subp 指令 以 外 , 1A32 还 有 一 些 指令 是 从 存储 器 或 基 个 除 多 st(1) 以 外 
的 祥 总 霖 行 器 中 读 出 它们 的 第 二 个 操作 数 的 。 罗 外， 它们 也 都 有 弹出 和 和 不足 出 这 贞 个 变 和 。 囊 组 
指令 从 行 储 秦 中 读 出 第 二 个 操作 数 ， 这 个 数 可 以 是 单 精 度 、 双 精度 战 整数 格式 的 。 然 后 ， 它 其 把 这 
个 数 特 换 成 扩展 精度 格式 , 海 栈 人 而 元 素 减 去 这 个 数 ， 并 禾 盖 栈 硕 元 素 。 这 可以 看 成 是 一 个 滩 点 加 载 ， 
Ii BL РЕН BRE SE S. 


бера Асат stio] Ma[Addr] kst (Ü) 
tsubl Addr isti Mig A ddr] kac (б) 
saubt Addr &er (üt МА] ТМ 


f£isubl Addr $ati] Ma[Addr] жекіру: 
fsub $et 11},%st -， isti) БЕ (2) 
tsub БЕ (1), Бі 11! 214 48111) tutii) 
tsubp tarii stii) ал tat {i} ЖЕЕ (2) 





sukro 210 $srL [ij iskil) 


图 3.34 浮 点 减法 指令 
所 有 的 指令 都 将 结果 以 扩展 精度 格 虑 存放 刘 个 浮 点 涯 存 器 中 。 带 后 级 “p” 的 指 邻 会 撞 出 栈 硕 元 素 . 


常 二 组 减法 指令 以 栈 顶 元 素 作 为 一 个 参数 ， 以 另外 “个 栈 元 素 作 为 另 一 个 参数 ， 但 是 它们 的 参 
狐 顺 序 、 结 果 所 使 用 的 日 的 ， 忆 及 基 否 会 阐 出 栈 硕 元 素 者 是 不 - 样 的 。 注 意 ， 汇 编 代 码 行 fsubp 
Ж fsubp 和 S-，$Ssttl) 的 简写 。 这 一 行 对 应 十 我 们 假设 的 栈 求 值 器 的 subp 指令 。 也 就 是 ， 它 计 
算 栈 项 两 元 素 之 状 ， 将 结果 存放 在 st(1) 中 ， 然 后 弹出 名 5t(0)， 这 样 计算 出 的 入 就 在 栈 顶 了 。 

333 中 列 出 的 所 有 双 操 作 数 操作 ， 部 有 图 3.34 中 列 出 的 fsub 的 所 有 变种 。 例 如 ， 我 们 可 以 
用 TIA32 指令 瑟 出 表达 起 -іа-Ы -b+e) 的 代码 。 为 了 说 明 方 便 ， 我 们 谷 然 使 用 存储 器 位 置 的 符号 
BFP МЕН ХАЖ ЕНЕ. 


3 Ісі %=L (0) 


з айа с 7 -b4rc | kst(0) 
1 fldla %st(1) 


[a аво 
` шл isti 

ast (0) 
5 tmulp (a — Б)(— + c) atid 


Гәкрі x 


HKE ек, ЖЕЖ АҚ x= (arb)+H(-(atb)j+e)。 注 意 是 如 何 用 指令 Eld gst co) 在 楼 中 创 
жаз ПЕ ЖЕН, RIRS T ki AE RESET P OR AEG f, 


б 
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fldl a | а | %st 10) 


fld #st{0] 


stil) 

а-% teki) 

кз Tasa 
sst (0) 

ене T ур [зш 
= (а 5 b) +c %st (Ü) 


fmulp (-(a.b)+ r). a. b Фа (0) 


练习 题 3.27 
画 出 下 述 代 砚 每 一 步 之 后 入 的 内 容 : 


5 


7 


fldl a &stíl) 
Жы (0) 
Emul %sti)) ,*st &stíil) 
秆 St [0) 
Гхеһ Жет ri) 
ЖЕТ (6) 
Etdivrl c ФЕ (1) 
5.0) 


Esubrp T өне 


fsto x 





用 一 个 忆 表达 式 来 描述 这 个 计算 ， 


3.14.5 在 过 程 中 使 用 浮 点 
АЗЕ С ВЕ, 浮 点 参数 是 通过 栈 传递 给 调用 过 程 的 。 每 个 float 类 型 的 参数 需要 4 个 字 节 的 

fk Plaj, ПП double 类 型 的 参数 需要 8 个 字 节 。 对 于 返回 秆 为 float 或 double ЖАНЫ, ЕҢ 

是 以 扩展 精度 格式 在 浮 点 寄存 器 栈 枯 部 返回 的 。 
作为 一 个 示例 ， 看 看 下 面 这 个 函数 ; 


1 
2 
i 
4 


Ж еър, 2 а, x. b 和 i КЕЛ S. 16. 20 和 28: 


double funct (double а, float x, double b, int i) 


{ 
returr a*x - b/i: 


) 
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В Е, RR a tu PB: 
l fildl28tkebp] | i  — Testi 


2 fdivrl 20í£*ebp) | bii %st10) 
3 tlds 16;*sbp! &zt!il) 
tatit 
РА fmull Sl%ebp? bri $stil) 
isti 
° feubp Ӛз 4 | шу- Тазша) 
з 3.28 


对 于 带 参 数 a、x, bb 和 1 (以 及 与 funct 不 同 的 声明 ) АЖ со, ЖЕЛ АКИ IEEE 
X FG AD. 
тау 8(%ерр), *еах 
Fidl 12 (%ерр) 
flds 20 {%ерр) 
movl *eax,-4i($ebp) 
#1191 -4(%ерр) 
іхсһ +51 (2) 
taddp %55,%5Е11; 
fdivrp €st,$stí.]| 
fid1 
Ü flds 24 (%еБбр) 
faddp #31, #500011 


ik MEG XX double. 5 Æ func СА, J Ж R Kit РА ERRAN, 


3.146 ЖАЫ SÉ 

Ш ГАНА, WEATER УНУНА ӨЗЕН ЕЕ Жи B Мм, Ж BM 
RI. 不过， 对 于 浮 点 ， 条 件 码 基 浮 点 状态 宇 的 一部分， FARETE- 6 ҚЗ, ЧЕ 
本 序 点 单元 的 各 种 标志 。 必 须 将 这 个 状态 字 转 换 成 整数 字 ， 然 后 测试 某 些 特殊 的 位 。 

如 图 3.35 所 汞 ， 有 很 多 不 同 的 序 点 比较 指令 。 所 有 这 些 指令 执行 的 部 是 操作 数 Op 和 Op, 2 
ІІМ, ЖЕ Op 号 栈 项 元 素 。 表 中 特 一 行 说 明了 两 条 不 同 的 比较 指令 ， 一 个 是 有 序 比 较 ， 用 
于 像 < 和 sg 这 样 的 比较 ， 而 另 一 个 是 无 序 比 较 ， 用 于 相等 的 比较 。 两 种 比较 的 区 别 只 在 于 它们 对 待 
NaN 值 是 不 同 的 ， 因 为 NaN 秆 和 其 他 值 之 间 没 有 相对 类 序 。 例 如 ，、 如 果 变 量 x 是 - -个 NaN, ТЖ 
ш y eO ДН, KAREA x< y A x= y 都 应 该 产生 0。 


k 
- 


3 XI Ман BIER 2.4.3 ЗЕ KH, 一 一 译 者 
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3.35 浮 所 比较 指令 
有 序 和 无 序 比 轻 不 同 之 处 在 于 它们 对 待 Na 值 是 不 问 的 。 


比较 指令 的 各 种 形式 的 不 癌 之 处 还 在 于 操作 数 Ор: ВУКУ Ё Я, 2540 PE л ЛД 122 aT 
术 指 令 的 党 部 形式。 最 后 ， 和 省 种 形式 的 不 同 之 处 还 在 于 ， 在 比较 完成 后 从 栈 中 漳 出 的 元 素 的 个 数 。 
表 中 所 下 的 第 一 组 指令 根本 不 会 改变 栈 。 即 使 是 对 于 一 个 参数 在 存 情 器 中 的 情况 ， 最 终 这 个 值 也 不 
会 放 在 栈 中 。 第 二 组 中 的 操作 会 将 元 素 Op 弹出 栈 。 而 最 后 一 个 操作 则 会 将 Ор, 和 Ор, 9188. 

指令 fnstsw 将 浮 点 状态 字 传 适 到 -个 整数 寄 丰 器。 这 条 指令 的 操作 数 是 图 3.2 中 所 永 的 16 {7 @ 
他 器 标识 从 中 的 一 个 ， 例 如 免 ax。 状 态 字 中 ， 对 比较 结果 编码 的 位 是 状态 字 的 高 位 字 节 的 0、2 和 6 
М. НІШ, ШАЯН fnstw Фах 传送 状态 字 ， 郑 勾 四 应 的 位 就 在 免 册 中。 选择 这 些 位 的 典型 
РАЛЕ Ж RM: 

1 fnstsw Фах More floating point status word in %ax 

2 апар $69,*ah Mask ail but bits 0, 2, and 6 

注意 ， 的 的 位 表示 为 [00100101]， 也 就 是 ， 三 个 相应 位 上 的 值 均 为 1。 图 3.36 给 出 了 由 这 段 代 
码 序 列 得 到 的 字 节 名 ah 可 能 的 值 。 注 意 ， 对 于 比较 操作 效 Op, 和 Op 只 有 四 种 叮 能 的 结果 : 第 -- 个 
数 人 于 、 小 于 、 等 于 第 二 个 数 ， 或 是 两 者 不 能 比较 ， 只 有 当 一 个 值 为 NaN 时 ， 才 会 出 现 最 后 一 种 结 
H, 





图 3.36 对 浮 点 比较 结果 的 编码 
结果 编码 在 兆 点 状态 宇 的 高 位 字 节 ， 屏 项 了 除 0、2 和 6 以 外 的 其 他 位 ， 


ЖЖ МТЖ; 
1 int lessídouble x, double y) 
2 [Í 
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E return x < Y; 

4 ) 

jx Ar bf CE A ТЕУ EDS FE: 

1 [ld] 16(%ерр) Push у 

2 fcompl 8 (%ерр) Compare ух 

3 InsLsw %ах Store floating point status word ің Фах 

4 апар 569, ah Mask all but bits Ü, 2, and 6 

5 sete žal Test for comparison outcome of Ü ( 

Б novzbl šal,%eax Copy low order byte to result, and sel rest to 0 
5 3188 3.29 


请 说 明 ， 如 何 通 过 在 前 面 的 代码 序列 中 插入 一 行 汇编 代码 ， 就 能 实现 下 面 的 函数 : 
i int greaLer(double x, double y) 
2 Í 
3 return X > y; 
4600) 

现在 ， 我 们 就 讲 完了 用 1A32 进行 汇编 级 浮 点 编程 。 即 使 是 有 经 验 的 程序 员 也 会 觉得 这 些 代 全 
很 神秘 ， 难 芭 阅 读 。 基 于 栈 的 操作 ， 将 状态 结果 从 ЕРО 读 到 主 处 理 器 的 笨 插 ， 以 及 肖 点 计算 的 许多 
细微 之 处 ， 都 使 得 机 器 怀 码 元 长 而 星 汲 。 值 得 注意 的 是 ， 如 果 数 字 程 序 被 编码 为 指定 格式 ， 则 Intel 
各 它 的 竞争 者 们 生产 的 现代 处 理 器 就 能 够 使 这 些 数字 程序 达到 相当 高 的 性 能 ， 


3.15 “在 C 程序 中 其 入 汇编 代码 


在 早期 的 计算 中 ， 大 多 数 程序 都 是 用 汇编 代码 写 的 ， 即 使 是 很 大 型 的 操作 系统 也 是 在 没有 高 级 
语 吉 帮助 的 情况 上 编写 的 。 就 程序 的 复杂 性 来 说 ， 这 就 变 得 难以 管理 了 。 因 为 汇编 代码 不 提供 任何 
形式 的 奖 型 检查 ， 折 以 很 容易 犯 基本 的 错误 ， 例 如 将 指针 作为 整数 来 用 ， 而 不 是 问 接 引用 指针 。 更 
情 的 是 ， 用 汇编 写 代 公 会 将 整个 程序 限制 在 某 一 类 机 器 上 了 。 重 写 一 个 汇编 语言 程序 ， 使 它 能 在 不 
同 的 机 器 上 运行 ， 与 从 头 写 整个 程序 是 - 样 困难 的 。 


ӘҢ. ШЇ КЕНДЕ ЖЕНЕ 

Frederick Brooks, I, -HEARR dap KB, ШЕ T XT 05560 ARARA. OS/560 < IBM 
机 器 的 一 个 早期 操作 系统 [5]， 直 到 今天 它 还 提供 了 很 多 重要 的 经 验 。 通过 写 这 些 东 西 ， 他 咸 为 了 用 
高 级 诺言 进行 系统 编程 的 惠 心 拥护 者 ， 不 过 ， 令 人 恒 奇 的 是 ， 有 一 组 活跃 的 程序 呐 ， 他 们 很 高 兴 为 
[A32 Ж ЕЁ РЫН, 他 们 通过 Internet 新 闻 组 comp.lang.asm.x86 来 被 此 联系 , 他 们 中 的 大 多 教 为 DOS 
操作 系统 编写 计算 机 游戏 ， 


早期 的 总 级 编程 语言 的 编 关 器 不 能 产生 非常 有 效 的 代码 ， 也 不 能 提供 系统 程序 员 常 常 关 要 的 对 
ЛІ GUD 表示 的 访问 ,要求 高 性 能 或 党 要 访问 目标 《代码 》 表 小 的 程序 通常 还 是 用 汇编 代 
码 来 写 的。 不 过 现在 ， 优 化 编译 器 基本 上 使 得 性 能 优化 不 再 是 用 汇编 代码 写 程序 的 ТАНЫТ. 
个 高 质量 的 编 详 器 产生 的 代码 通常 和 手工 编写 的 一 样 好 ， 甚 至 于 更 好 。 而 5 语 上 基本 十 使 得 机 咱 切 
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I] 4 SSH ABT. Са BBS BILIK S ЛИНЕ is WU АК AUR. ЖАРАУ ЖҚ 
不 坟 行 操作 ， 这 就 为 人 多 数 程 奈 员 提 供 了 是 够 多 访问 机 器 的 能 力 。 例 如 ， 像 Linux 这 样 的 现代 操作 
系统 ， 几 乎 每 个 部 分 者 是 用 СУ. 

尽管 如 此 ， 厂 时 做 用 汇编 弓 代 码 仍 然 是 惟一 的 选择 ， 特 别 是 实现 操作 系统 时 咒 更 中 这 翌 。 比 齐 
说 ， 扣 作 系 统 必须 访问 - - 些 特 殊 的 寄存 器 ， 它 们 存放 着 进程 状态 信息 ,执行 输 入 和 窒 出 灌 作 故 便 用 
特殊 移 指 念 或 是 访问 特殊 的 存 赃 器 位 置 。 即 使 是 对 应 用 程序 员 来 党 ， 也 有 有 一些 机 器 特性 ， 例 如 条 件 
GRE. EPR ERN C 访问 的 。 

ЖИЛЕ И) BR EE REPE EEH CHARETTE ЕРЕ ИВО Н. — Bh A E HLS 
EKRAR TERIS ЖЕНТ в (TL UM C RERA ІН E. ЖОШ A COR ECC 
REP: НЕН ЕН ЕНІН СЫН ЯН АНЫН SUA Oo EK. БИШ, MRI plc S 
CO, Ju рә. УЙНАП ТЫ, ЖАЙТ 


unix» gcc -o p pi.c p2,5 


会 编译 文件 pl.c HUS X TE p2s, IERE ЯНУ НКТ ЕВР nk BT PT Е р. 


3.15.1 ЖЇН iN (inline assembly) 

GCC 还 可 以 将 汇编 与 C {МӘ S ЖБ Ж.И ЕКИ SS FC VER P КЕ VE IE IH CREE Т RAN 
IL. Өр К E. ІНЕН ТЕ ІН POE LIT Adi d ЖЗ тр ЛЕ ар ras. 03 
然 , 得 到 的 代码 是 与 机 器 高 度 相关 的 , [А А) КЕЗЕН ЕНІП ӘНЕ АЖЕН). asm tin Cdirective) 
也 是 与 ОСС 相关 的 ， 它 与 很 多 其 他 编 详 器 是 不 兼容 的 。 尽 管 如 此 ， 这 还 是 一 种 有 效 的 方式 ， 将 与 
ТИН КН СА Е, ЗІ АА 2, 

P CT d EA GCC 信息 档案 的 一 部 分 来 说 明 的 ， 在 任何 安装 了 GCC 的 机 器 上 执行 命令 info 
асс, 会 得 到 一 个 分 层 的 文档 阅读 器 。 沿 看 名 为 “C Extensions ”的 链接 ， 然 后 是 名 为 “Extended Asm” 
的 链接 ， 就 能 找到 内 内 汇 编 的 文档 。 不 桩 的 是 ， 这 个 文档 有 点 不 完全 ， 也 不 太 准 确 。 

内 蜂 江 . 编 的 基本 糙 式 是 像 过 程 调用 一 样 写 代 码 ; 

asmi code-string ) ; 


术语 code-string 表示 一 个 以 带 括号 的 学 符 串 形式 给 出 的 汇编 代码 序列 。 编 译 器 会 将 这 个 字符 捉 
一 子 不 差 地 搬入 到 产生 的 汇编 代码 中 , 因此 , 编译 器 提供 的 汇编 和 用 户 提供 的 汇编 就 合并 到 一 起 了 , 
编 详 器 不 会 检查 字符 串 是 否 出 错 ， 因 此 ， 要 等 到 汇编 器 才 会 报告 错误 ， 

我 们 以 个 需要 访问 条 件 码 的 例子 来 说 明 asm ИНЕҢ. ЖЕРЛІ КІН. 

int ok smulíint x, int y, int *dest); 

int ok umulíunsigned x, unsigned y, unsigned *dest!; 

每 个 咕 数 都 用 来 计算 参数 x 和 y 的 乘积 ， 并 将 结果 存放 到 参数 det 指定 的 存储 器 位 置 中 。 至 于 
ЖЕН, НК expo. {И 1. 有 符号 乘 和 无 符号 匀 是 枫 个 函数 ， 因 为 它们 的 谥 出 情 
Ді Ін Еу; 

分 机 1А32 3892482 mul 和 imul 的 文档 ， 我 们 看 到 在 溢出 时 ， 中 个 指令 都 会 设置 进位 标志 СЕ. 
RAR 3.10, 我 们 看 到 指令 setae 可 以 用 来 在 CF 标志 设 为 上 时 , 将 - -个 寄存 器 的 低位 字 节 设置 为 小 
百 则 三 设置 为 1]。 因 此 ， 我 们 希望 将 这 条 指令 插入 到 编译 器 产生 的 序列 中 。 
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在 试图 使 用 尽 可 能 少 的 汇编 代码 和 详细 分 析 后 ， 我 们 试卷 用 下面 的 代码 来 实现 ok smul: 


MÀ = 


------ ecode/asm/okmul.c 
/* First attempt. Does not work */ 

int ok smull(int x, int y, int *des:) 

1 


irt result = 0; 


* Gest = х%у; 
asmí("sxetae *al"!: 


1 
2 
3 
4 
D 
b 
- 
B return result; 
9 


-一 -一 ———n `  —Twade/asw/okmul.c 

ЖАНТ FUH) ЕЕ А ат еах ХН ЖОК ШНА ЙУ, oid PE л H T Sy I a K r LAE ER 
result, w TK CREATE RR Е 0. NKT бат X F f ИОА EIER E ИМ, 
而 这 个 寄 仔 髓 会 用 来 作为 返回 值 。 

DERE ССС 有 人马 目 己 的 关于 代码 产 生 的 窟 法 。 产 生 的 代码 并 不 会 在 函数 一 开始 时 就 将 寄生 
вах 设置 为 0， 历 是 审 最 后 才 这 人 么 做 ， 所 以 函数 总 是 返回 0。 最 根本 的 问题 是 ， 编 详 器 无 法 知道 
竹 序 员 的 草图 是 什么 ， 也 恋 法 知道 沪 编 语句 庶 该 吉 柯 与 其 他 产生 的 代码 欧 旦 。 

通过 -系列 举 试 ( 行 会 儿 我 们 会 详细 介绍 更 加 系统 的 方法 }， 我 们 能 生成 可 行 的 代码 ,得 是 这 也 
TREE: 


-一 一 一 IO 
i /* Second attempt. Works in limited contexts */ 
2 int dummy = 0; 
3 
4 inL ok smul2(irt x, int y, int *dest) 
2 1 
5 int result; 
7 
8 *dest = x*y; 
9 result = dummy; 
10 asmi"setae Wal"); 
11 return result; 
13 ! 
一 一 一 -一 一 — code/asm/okmul.c 


X BLU REUS ERIT ERE, HUE ERIS ЕЗЕШ dummy 的 值 来 将 result 初始 化 为 0， 
对 于 产后 包含 全 癌变 量 的 代码 ， 编 译 器 通常 会 比较 保守 ， 所 以 不 太 可 能 会 重新 排列 计算 的 顺序 。 

前 面 的 代 玛 依赖 于 编 详 器 能 够 处 理 得 当 。 实 际 上 ， 只 有 当 编 译 器 的 优化 选项 【命令 行 选项 -O) 
是 打开 的 时 候 ， 这 段 代码 才能 正常 .工作 。 当 不 带 优化 编译 时 ， 它 会 将 result 存放 存 栈 中， 在 返回 之 
BIBLE, WERE setae 指令 设置 的 值 。 编 译 器 无 法 知道 插入 的 汇编 语言 与 其 他 代码 之 问 的 关系 ， 因 为 
我 们 没有 提供 给 编译 器 这 样 的 信息 。 
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3.15.2 asm 的 扩展 格式 

GCC 提供 了 asm 的 一 个 扩展 版 本 ， 它 允许 程序 员 指定 哪些 程序 值 要 作为 汇编 代码 序列 的 操作 
儿 ， 以 及 哪些 寄存 器 要 梳 汇 编 代 码 履 瑚 。 有 了 这 蔚 信 县 ， 编 译 器 产生 的 代码 就 用 正确 建立 所 需要 的 
党 值 ， 执行 沪 编 烘 令 ， 并 使 用 计算 出 的 什 。 这 些 信 息 中 还 包括 编 详 器 所 舌 的 关于 寄存 器 使 用 的 信息 ， 
这 样 -一 来 ， 重 要 的 程序 值 就 不 会 被 汇编 心 码 指令 笨 盖 了 。 

S REPLETUS RITE ROS TERT: 

asmi code-string | ` ontput-list | : input-list | : overwrite-list ] | ] X 

АН, Jj SOR RD E. ЈА RESI АЛТАЙ {СШДЕ R, np e ik a 
d. апан ОЙ Sf PT АВ). ЖА СШ ЛЕЙ ТШД, PLAY {МШЕ 
pipes. 这些 列 表 以 由 号 《: ) SEE. КЕШЛ SRNR, Wila A SOR T MESE TAURI 
£. 

ҚОНЫ I E LE A REGES рї 语句 中 格式 化 字符 串 的 语法 。 它 是 由 一 个 用 分 号 C ABRIL. 
编 代 码 指令 序列 组 成 的 。 输 入 和 输出 操作 效 由 引用 免 0， 免 |，…， 免 9 表示 。 操 作 数 是 根据 它们 第 一 
次 在 输出 列表 香 输 入 列表 中 出 哎 的 顺序 编号 的 。 像 “%eax” 这 样 的 寄存 器 名 学 必须 要 多加 -一 个 " 声 ” 
е, UNA “oheak” 

РІ ок smul 的 一 个 更 好 的 实现 ， 它 使 用 扩展 的 汇编 语句 来 告诉 编译 器 汇 编 语 避 是 为 变量 
result P“ ТИН: 





Code/asm/okmul.c 
1 /* Uses extended asm to get reliable code */ 
2 int ok smuliíiant x, int v, int *dest) 
3 { 
4 int result; 
5 
5 *dest = x*v; 
7 
8 /* Insert the following assembly code: 
Ü selae ОҒЫ # Set low-order byte 
10 тәу? Wh, result # Zero extend to be result 
11 */ 
12 asmi "setae +%р1; movzbl %%b1l, %0" 
13 : "cr" result) е Output */ 
14 Ж No inputs */ 
15 : "ebx" /* Overwrites */ 
16 E 
1 
18 return result; 
13 | 
——7 code/asm/okmul.c 





P ИКТЕ S IL s R r Ed АРЫ cp. ЖЕ, LAB SOR LETT RP 
展 ， 并 拷贝 到 编 详 回 选择 的 用 来 保存 result 的 随便 哪个 寄存 器 中 ，result 是 用 操作 数 %0 表示 的 。 输 
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出 列表 是 册 以 空 烙 分 隔 的 值 对 组 成 的 。( 在 本 例 中 ， 只 有 一 个 值 对 ,) 值 对 的 第 一 个 元 素 是 一 个 字符 
串 ， 表 了 明 操 作 数 的 类 型 ， 这 里 “r” 表 示 - 一 个 整数 寄存 器 ， 而 “=” 表 示 汇 编 代码 对 这 个 操作 数 进行 
了 赋值 。 值 对 的 第 二 个 元 素 是 用 括号 括 起 来 的 操作 数 . 它 可 以 是 任何 可 赋值 的 值 (在 C 中 称 为 左 值 ， 
lvalue)。 编 译 器 会 产生 必要 的 代 权 序 列 来 执行 这 个 赋值 。 输 入 列表 有 相同 的 通用 格式 ， 这 里 把 作 数 
可 以 是 任意 C 表达 式 。 编 译 器 会 产生 必要 的 代 公 来 对 这 个 表达 式 求 值 。 覆盖 列表 只 是 简单 地 给 出 会 
被 重 写 的 寄存 器 的 名 学 (作为 带 括号 的 字符 囊 )。 

无 论 编译 选项 如 何 ， 前 面 这 段 代码 部 能 正常 工作 。 正 如 这 个 示例 表明 的 那样 ， 要 编写 允许 操作 
数 按照 要 求 的 格式 书写 的 汇编 代码 ， 可 能 还 需要 .点 点 创造 性 的 思维 。 例 如 ， 没 有 直接 的 方法 来 指 
定 一 个 程序 值 作 为 setae 指令 的 日 的 操作 闭 ， 因 为 这 个 操作 数 必 须 是 单字 节 的 。 因 此 ， 我 们 编写 了 
一 个 基于 一 个 特殊 寄存 器 的 代码 序列 ， 然 后 用 … 个 额外 的 数据 传送 指令 来 将 得 到 的 值 扶 贝 到 程序 状 
态 的 某 个 部 分 。 


练习 题 3.30 

GCC 提供 了 扩展 精度 运 普 的 工具 。 它 可 以 用 来 实现 ok_smul 函数 ,优点 是 函 煞 可 以 跨 机 器 移植 . 
声明 为 类 型 “отр long” 的 蛮 量 的 大 小 为 普通 long EHR. A. 368) 

long long prod = {iong long) x * y; 
T x fc уйй 64 483848. 用 这 个 工具 ， 写 出 一 个 不 使 用 任何 asm i4] оқ, smu MA. 


8 Ап ОЯН, XXBUBXSHT SUR] DLE] TE оқ umul 中 ， 但 是 ， 对 有 符号 和 无 符号 法 ，GCC 用 的 
іле imull (有 符号 乘法 } 指令 。 АНЕ ТЕШ БІНЕ НИН, H k'u ЖЕШИН ЛЫ Rx 
TUNE ОДА К. ГИЙ, ФЕ Ж Sers], БАН 3.9 中 说 明 的 mull 指令 来 执 
行 无 等 导 乘 法 ， 这 段 代 码 如 下 所 示 ; 


code/asm/okmul.c 
1  /*Usesextended asm */ 
à int ok umulíiunsigned x, unsigned у, unsigned *dest) 
3 [Í 
á int resit; 
5 
6 Р insert the following assembly code: 
7 moy] х,%ёах # Сте x 
8 mull y # Unsigned multiply by y 
9 теуі tax, *dest # Store low-order 4 bytes at dest 
10 setae %dl # Set low-order byte 
11 movzbl %dl result # Zero extend to be result 
12 "y 
13 asmi"movl %2,%%сах; mull $3; тоу] %%еах,%0; 
14 setae *€*dl; movzbl %%dl1,%1" 
15 : "cry" [*dest), "=r" (result) /* Outputs */ 


4 实际 上 上 ， 你 可 以 用 GCC ER 全 类 型 为 char АЖЕН DRETTEN, SA httpi/www.csapp.cs.cmnu.edu/public/ 
byteasmhtmi, - -一 译 者 
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16 : "Т" (x), "z" {y} i* [nputs */ 
1" | "Aleax", "Фейх" % Overwrites */ 
18 E 

19 

20 return result; 

2L } 


code/asm/okmul.c 


回忆 ^P. ml HARKEN- ТӘЖ ЕН Феах 中 ， 而 第 一 个 参数 是 作为 操作 数 给 出 的 。 
为 了 说 明 这 一 点 ， 在 авт 语句 中 ， 我 们 用 mov 将 程序 值 x Е oean HERET y 是 mull {Ë 
令 的 参数 。 然 后， 指令 会 将 8 TT ИЕР АЕ ЛЕРІ ТЕН ЗЕН, Феах ЖАРЫМ 4-75 71, ІПФейх 
жне. ЕН тей ЖЕЛЫАНЫ. Emea JUL BHI IPE, 8 CO 用 来 
А АЛЕ УЕ Т ЛШ ЖЕ. ОАЕ УГЕ Л w rana. НЕЕ. RIERA *dest 
指定 为 第 二 个 тоу 指令 的 输出 ， 因 为 它 是 可 赋值 的 . TE Ж Р E КРАН, eax 
中 的 值 丰 情 在 这 个 存 悄 回忆 实 上 。 

AE ТАРЫ ЕН Ж АҒ аяп 语句 的 代码 的 ， 下 面 是 为 ok_umul 产生 的 代码 ; 


Ser up asm inputs 


1 movi ВіЗзерро), Фесх Load x into Фесх 
2 movl 12{%еЬр\!,%еһх Load y into ebx 
3 movl 16{%е]р),%ев1 Load dest into Фезі 


The following instructions were generated by asm. 
Input registers: Фесх for x, %ebx for y 
Output registers: Фесх for product, 9oebx for result 


4 movi Тесх,феах; mull %еһх; movl Зеах,Фесх; 
5 setae &dl: movzbl #01, %ерх 
Process asm outputs 
6 movl $ecx, (Жекі) Store product at dest 
7 movi &ebx,t*eax Set result as гент value 


这 段 代码 的 第 1 一 3 行 取 出 过 程 参 数 ， 并 将 它们 存放 到 寄存 器 中 。 注意 , CRAEN AA bea 
或 免 edx， 因 为 我 们 已 经 声明 了 这 两 个 寄存 器 会 被 重 号 。 第 4 行 和 第 5 TERKA RCRA, A 
过 参数 换 成 了 寄存 器 的 省 宇 。 特 别 地 ， 它 会 用 寄存 器 Wecx 代替 参数 名 7 ОО, Фе 代替 参数 %3 
(y)。 乘 积 会 暂时 存放 在 %ecx 中 ， 而 它 会 用 寄存 器 %ebx НШІ (result), ЖБ, 8617 H3 
Tr | dest， 完 成 了 对 参数 %0 (*dest) БІНЕ, 第 7 行将 төш Л ЗТ Феах, БЕІН, 
因此 ， 编 详 器 不 仅 产生 了 我 们 asm 语句 指示 的 代码 ， 还 产生 了 提供 语句 输入 “第 1~3 行 ) 和 使 用 
输出 (第 6~7 行 ) 的 代码 。 

A asm 语 同 的 语法 有 点 难 届 ， 而 日 它 的 使 用 也 使 代码 的 可 移植 性 变 差 了 ,但 是 对 于 编写 用 
少量 汇编 代码 来 访问 机 器 级 特性 的 程序 ， 这 条 语句 还 是 非常 有 用 的 。 我 们 发 现 ， 要 想 代码 能 正常 
工作 ， 是 需要 进行 一 些 党 试 和 犯 点 错误 的 。 最 好 的 办 法 就 是 用 -$ 选项 编译 选项 ， 然 后 检查 产生 出 
的 汇编 代码 ， 看 它 是 否 达 到 了 期 望 的 效果 。 民 码 还 应 该 用 不 同 的 选项 设置 来 测试 ， 例 如 带 和 不 带 
-0 选项 。 
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3.16 Ма 


EXET, ПЕН ТВЕН e PERU S ke ТШШ КН, БАТ ЛЕЙ КЫЛ. XE ibd TES 
PU EIL ТЕНГ ҢІН Ел. ЖІТІМ ЕНГ АЛИ BU. БАЛТА. к) S 
ЖЧ ЕНИН УЕ. 95 атр, Fie 3821), "iba АЕ ЕН ЗІНЕ КИЧЕН, J WE PE añ J 
НА И. RILE Г ТА аЗ КОЕН X< By k n ЖД 性 的 例子 ， 例 如 ， 浮 点 代 
ЧЇ АНГИНА ҒАН, 还 是 在 存储器 中 。 存 第 13 章 中 ,我们 会 看 到 许多 这 样 的 
例子 ， 我 们 需要 知 志 个 程序 变量 是 在 运行 时 栈 中 ， 是 在 革 个 动态 分 配 的 数据 结构 所， 还 挟 在 茶 个 
人 局 看 情 笨 置 中 。 理 解 程 序 是 如 何 映射 色 栅 器 上 的 ， 会 让 理解 这 些 存 情 之 间 的 区 别 容易 С, 

并 继 证 言 与 局 代 公 差别 很 大 。 在 汇编 语 训 程 字 中 ， 各 种 数据 类 型 之 间 的 差别 很 小 。 程序 是 以 指 
邻 序列 来 表 水 的 ， 每 条 指令 都 完成 一 个 单独 的 棵 作 。 部 分 程序 状态 ， 栎 寄存 器 和 运行 时 栈 ， 对 各 序 
员 来 党 是 直接 可 见 的 。 局 提供 了 低级 谍 作 来 交 持 数据 处 理 和 程序 控制 。 编 洋 器 必须 用 多 条 指令 来 产 
生 和 操作 各 种 数据 结构 ， 来 实现 像 条 忻 、 循 环 和 过 程 这 样 掀 控制 结构 。 我 们 讲述 了 CC ЖЖ ЕС 
的 诈 多 不 可 方面 。 我 们 看 到 台中 缺 季 边界 答 查 ， 使 得 许多 程序 容易 出 现 缓冲 区 准 出 ， 而 这 已 经 使 许 
多 系统 容易 受到 入 侵 者 的 恶意 攻击 。 

我 们 只 分 机 了 C 到 1A32 的 映 射 ， 但 是 我 们 讲 芍 大 多 数 内 容 对 其 他 语 圭 和 机 器 给 合 粹 说 也 是 类 
iN. л, Ж C++ 与 纲 详 CC 就 于 党 相似 。 实 际 上 ，C++ 的 早期 实现 就 只 是 简单 地 执行 了 从 C++ 
ЖОС 的 源 刘 源 的 转换 ， 共 对 结果 运行 C 编 译 器 ， 产 生日 标 代码 。C++ 的 对 象 用 竺 构 米 才 杰 ， 类 似 于 
C 的 stmuct，C++ 的 方法 荐 用 指向 实现 方法 的 代码 的 指针 来 表示 的 。 相 比 而 言 ，Java 的 实现 方式 完全 
^^]. Java 8] E Bj f C03 E РЕ АЈ S Rus, ERO Java 字 节 代码 。 这 种 代 公 可 以 看 成 是 虚拟 机 
的 机 器 级 程序 。 正 如 它 的 名 字 瞳 小 的 那样 ， 这 种 机 器 并 不 是 直接 用 硬件 实现 的 。 相反 ， 软 性 解释 器 
ЖЕ ҮІ, 模拟 虚拟 机 的 行为 。 这 种 方法 的 优点 是 相同 的 Java 字 节 代码 可 以 在 许多 不 同 的 机 器 
上 执行 ， 向 我 们 在 本 章 谈 昏 的 机 器 和 代码 只 能 在 IA32 上 上 运行。 


参考 文献 说 阴 

XTIA32 最 好 的 参考 书 日 来 良 于 mel 他们 关于 软件 开发 的 系列 中 有 上 帅 本 特别 有 用 。 基 本 体 
系 纳 构 手册 [18] 给 出 了 从 汇编 语言 程序 员 人 角度 来 看 的 体系 结构 概 莹 , 而 指令 集 参 性 手册 [19] 给 出 了 各 
种 指令 的 详细 描述 。 这 些 参 考 书 日 包含 的 信息 远近 超 册 了 理解 Linux 代码 所 需要 的 内 容 - 特别 地 ， 
Linux 使 用 平面 模式 寻 址 ， 所 有 分 段 寻 址 方法 的 复杂 性 都 可 以 不 予 兰 虑 了 。 

Linux ?L 28 25 FH] GAS 2 5 Intel 文档 中 以 及 其 他 编 详 跨 (特别 是 Microsoft ^r" 0599 ВЕ 
司 用 的 标准 格式 差别 很 大 。 -个 主 归 区 别 就 是 源 和 日 的 操作 数 是 以 相反 的 顺序 给 出 的 。 

(Е Linux 9,38 Е. is] gp infoa 会 显示 有 关 江 绩 器 的 信息 。 其 中 一 个 小 部 分 说 明了 与 机 吕 相 
大 的 人 已， 包括 GAS 与 更 标准 的 Intel 表 永 法 的 比较 ， 注 意 ，GCC 称 这 些 机 器 为 “i386 ”一 一 它 产 
ЕНЕ ET AAE 1985 年 的 机 器 上 运行 ， 

Muchnick 的 关于 费 评 器 设计 的 苦 作 [55] 被 认为 是 有 关 代 码 优化 技术 最 全 面 的 参 首 文献 。 它 村 盖 
了 我 们 在 此 讨论 的 许多 技术 ， 例 如 寄存 器 使 用 规则 和 基于 do-while АЗЫРАҚ АД. 

ХТ pl Intemet 用 绥 冲 区 滥 出 来 攻击 系统 ， 已 经 有 很 多 论述 了 。Spafford[?3] 出 版 了 关于 1988 
F Internet 蠕虫 的 详细 分 析 ， 带 助 制止 这 种 蜂 虫 传播 的 MIT 的 一 些 人 也 出 版 了 一 些 论 著 [26]。 从 那 
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EE. ӘЖ ТҮРЕ АТАЛА ЕНГЕН тИ СНИ H, Pino. 


家 庭 作业 
3.31 Ф 
给 你 如 下 信息 。 


ЖИЕ 


int decode2[int x, int y, int z); 


ЖСК ТЕНГЕ. ICI UH: 


1 

А 

3 

4 

5 imull 
Б sall 
7 

5 


movl 154%еБр), *еах 
movi 12А1%ерр), едх 
subl %еах, едх 
movl €edx,*€eax 


3 (%ерр)}, $edx 


531  S$Seax 
Sarl 521, %еах 
xorl *edx,'€*eax 


参数 x、y fl z AERE SERRE RESET SEES ebp 中 地 址 偶 称 量 为 8、12 和 16 HR] (МЖ 
ЖИН rik ar ERR bear 中 。 

与 出 等 价 于 我 们 汇编 代码 decode? 的 C 人 代码 ,可 以 通过 用 -S 选项 编 详 你 的 代码 来 测试 你 的 答案 。 
你 的 编 详 絮 产 生 的 代码 不 定 完全 一 样 ， 但 是 功能 应 该 等 价 ， 


3.32 %ф 


К C 代 得 基本 .上 与 图 3.12 中 的 代码 相同 ， 


l int absdiff2(1nt x, int y) 
2 1 

3 int result; 

4 

5 if (X < y) 

Ü result = у-х; 

7 alse 

8 result = x-y; 

3 return result; 

19 1 

ЛУН ЕН], R N TEEL AS: 
1 movl Sí(&ebp),€edx 

2 movl 12{%ерр},%есх 

3 movl Жейх,%ғах 

4 subl Жесх,Жеах 

5 cmpl %ecx,%ejdeÁ 

Б jade .L3 

7 movl Жесх,%еах 

8 subl tedx,£&eax 

9 D3: 
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A, Мхе<у, ДИВА? 03 x>y ВЕ? 

B. 这 段 代 码 与 前 向 讲 运 的 if-else 的 标准 实现 有 作 么 不 同 ? 

C. 用 已 语法 (包括 рою), ЧА ВЕНЬ. 

D. ДТ ЕНЕ С 代 得 指 是 的 行为 ， 整 对 箔 的 使 用 加 上 上 什么 样 的 限制 ? 

3.33 ФФ 

PIRA IB T CAREA НЕ POSSE RU od tmo SERE EP. (ЕМА CP. C иу 
类 型 只 是 一 种 引入 -- 组 与 整数 值 相 对 应 的 儿子 的 方法 。 默认 情况 下 , 值 是 从 0 18] ECCE А0, 
ТЕАИ Ц, ЖҚТ НАНЫН (case labels) 相对 应 的 动作 。 

{* Enumerated type creates set 0f constants numbered © and upward */ 


tvpedef enum (MODE A, MODE B, MODE C, MODE D, MODE E] mode t; 


int switch3[int *pl, int *p2, mode t action) 
{ 

int resull = 0; 

switch(action) Í 

case MODE A! 


case MODE B: 
сазе MODE C: 
Case MODE D: 
Case MODE E: 
default :; 


| 
return result; 
} 


pe: BSEC IHRER ТКО 3.37 所 示 。 注释 表 明了 存储 在 寄存 器 中 的 值 ， 以 及 各 
个 跳 园 日 的 的 情况 标号 。 
А, ЕҤ ЛЕШ result 对 应 于 哪个 寄存 器 ? 
B. 卉 与 出 C 代码 中 缺失 的 部 分 ,注意 会 落 入 其 他 情况 (cases) AR Case). 
The jump targets 
Arguments pi and p2 are in registers Webx and Фесх. 


1 115; MODE А 

2 movl Жесх), ѕеӣҳ 

3 movl {%ерх),%еах 

4 movl £€eax, ($ecx] 

5 jmp .114 

Б .p2align 4,,7 Inserted to optimize cache performance 
7 ‚16: MODE B 

8 


mov] í(*ecx),t*teax 


addl {ерх}, Феях 
movi $eax, ttebx) 
movl *eax,*edx 
jump .L14 
.pZalign 4,.7 
„LIF: 
movl &15,{%ерх} 
movl (ecx), edx 
этр .1,14 
.p2align 4,,7 


«Ін: 


movl ;*ecxl,teax 
movl $eax, (*ebx! 


‚1,15: 


movl $17,£erdx 
jmp .L14 
.pZalign 4,,7 


.L20: 


meyl 5-1, Фейх 
„114: 
movl %ейх,%®еах 


这 段 代 由 实现 了 switeh RARE М. 
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Inserted to optimize cache performance 
MODE С 


inserted to optimize cache performance 
MODE D 


MODE E 


Inserted to optimize cache performance 


default 


Set return үшіне 


图 3.37 作业 3.33 的 汇编 代码 


3.34 фф 

对 于 从 目标 代码 进行 逆向 工程 来 说 ， 并 关 语 句 是 特别 困 准 的 。 在 下 面 这 个 过 程 中 ， 走 掉 了 升 关 
庄 句 的 主体 ; 

1 int switch probíint x) 

2 1 

j int result = X; 

4 

5 &ewitchix) 1 

b 

7 Р Fill in code here */ 

8 | 

9 

10 return result; 

11 | 


图 3,38 给 出 的 是 这 个 过 程 的 反 汇 编目 标 代码 。 我 们 只 对 第 4~16 行 所 示 的 代码 部 分 感 兴趣 。 在 
第 44 行 我 们 可 以 看 到 参数 (在 相对 于 %ebp 偏 移 量 为 8 的 位 置 ) 被 加 载 到 寄存 器 名 eax 中 ， 对 应 于 
程序 变量 results $ 11 行 的 指令 lea (х0 (tesi), $esi 是 一 条 空 指令 ， 插 六 这 条 指令 是 为 了 全 
第 纪行 的 指令 的 起 始 地 址 为 16 的 倍数 ， 


1 080483с0 <вмікеһ prob»: 

2 80483с0: 55 push %ерр 

3 80483cl:; 89 eb mov $esp,tebp 

4 0483c3: 8b 45 08 mov uxa[€ebpl,teax 

5 8048166: 84 50 ce ез ÜxE£fffffce(teax),Stedx 

6 80483с9; 83 Ға 05 стр $0x5,t*edx 

7 80483cc: 77 1а за 80483eb zswitch prob40x2b- 
R 80483ce: £f 24 95 68 84 04 08 jmp *ÜüxSC48468(, еси, 4) 

9 9049495: cl ей 02 shl S0x2,t*eax 

19 5048348: ер 14 јар 80483ee «switch ргор+0х2е> 
11 80483da: 8c be 00 DO gü 320 lea 0х01%ев1),%еві 

12 S0483eD: c1 ЕВ 02 сат ӘПх2,Жеах 

13 80483е3: ер 09 дїр 8D483ee «sw:tch ргор+0х2е> 
14 я0483е5: Hd 04 40 lea (*eax,*eax,2)  Yeax 

15 80d83e8: ОҒ af cü imal %еах,%еах 

15 80483ер: 83 cO Па add 5Јха, %еах 

17 80483ee: BQ ec mov *ерр,%єевр 

18 80483f0: 5d pop $ebp 

19 8048311: c3 ret 

20 80483f2;: ВӘ f6 mov Зесі,Жені 


3.38 作业 3.34 的 反 汇 编 代码 


WERKES ЕМЕН, НА GDB， 我 们 可 以 用 命令 x/6w 0x8048468 ЖӨЖ А 
Зе АДЕ 0x8045468 开始 的 六 个 4 字 季 的 字 ，GDB 打印 出 下 面 的 内 容 ; 


adb) x6w 08048468 
0x80484558:  Ox080483d5 0x080483eb Ox080483d5 (OxÜüBÜ048360 


0x8048478:  0x080483e5 0x080483e8 

саб) 

H C 035 i r kin) ЕЖ, NA DH RREA 

335 ФФ 

СН var prod ele PERRI (A 3.250) 不 是 最 优 的 。 根据 过 程 fix. prod. eie. opt (E 
3.24) Hi var. prod ele opt СЁ 3.25), УНАР ЫН, ЖА n ORTUS RAD IE RA. {НДЕ 
成 的 代码 要 将 它 的 所 有 临时 数据 都 放 人 在 寄存 器 中 。 

四 忆 一 下 ， 处 理 器 只 有 六 个 宕 他 器 可 用 来 保存 临时 数据 ， 因 为 寄存 器 免 ebp Aesp 小 能 用 于 此 
Пк Ал НЕЕ OE EE TE SIN ESR. БН, ЖОЯМЫН НЕ 
从 六 (result, Арт. B. nTjPk. n 和 eno 减少 到 五 。 

336 ФФ 

ШАА Г CACHE CEP. ЖР ТИПА КИМА. 

1  typedeft struct { 

2 int left; 

3 а Struct a[CNT]; 
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4 irt right; 

5 ) b struct; 

6 

+ void LesLíint i, b struct “Бр; 

SB 

9 int n = bp-»left + bp-sright; 
10 a struct Жар = &Бр->а[1|; 

11 ap-»x[ap-»idx] = n; 

12 j 


ЖӘЕ, Ае ХЕЕЕ СМТ 和 和 结构 a struct 的 “.b ”文件 没有 访问 极限。 幸好 ， 你 能 
Ж УНИ ЫЙ “о” ЖЖ, п Н objdump 程序 来 反 汇 编 这 些 文 件 ， 得 到 如 图 3.39 Frog LR 
Б. 


1 00600000 «test»: 

2 0: 55 push *ebp 

3 1 89 ес mov Жер, %ерр 

4 3 53 push Зерх 

5 4: 8b 45 08 тоу (x8 (&ebp) , $eax 

Š 7: 8b 4d Oc mov Ссхс{(%ерр},%есх 

7 а ag 94 80 lea {%еах, %еах, 1), %еах 

9 3: ad 44 81 04 lea Üxdlitecx,t*teax,1],t$6ax 
9 1i; ab 1 mov (&eax) , edx 

10 13: cl ez 02 shl S0x2,*edx 

11 16: ab 9$ Ба 00 DO OO mov üxbBikecx),*ebx 

12 1с: 03 185 add |Жесх) ‚ерх 

13 le: 88 5c 09 04 mov tebx,0xá(*edx,teax,l) 
14 22: Sh рор %ерх 

15 23: 89 ec moy tebp,*esp 

16 25: 5d pop tebp 

1? 265: c3 ret 


图 3.39 作业 3.36 的 反 汇 编 代 三 

运用 你 的 道 向 工程 技能 ， 推 断 出 直列 内 容 ; 

A. CNT 的 值 。 

B. fifa struct DERBH., ERRERA H dx 和 x. 

3.37 ф 

58 3 — ERA. good_echo， 它 从 标准 输入 读 入 一 行 ， 青 写 回 到 标准 输出 。 你 的 实现 必须 对 任意 
长 度 的 输入 行 都 能 正常 工作 。 可 以 使 用 库 函 数 fgets， 但 是 必须 保证 ， 你 的 函数 即使 是 在 输入 行 需要 
比 你 为 继 冲 区 分 配 的 空间 更 大 的 空间 时 ， 仍 能 正确 工作 。 你 的 代码 还 应 该 检查 出 错 条 件 ， 当 录 到 错 
WI. АҒЫ UO RS HE УАЛИ УҒА |32, 40]. 
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EATA, ЖЖ ЖИН ДАШАТ ИКИ ЕЛЕ. ШЕГІН, {ПЕШ 


200 43% 


Hi B gi Hob Ж ҚАНДЕН RAE ЕЕЕ ЫНЫ. (НЫНА ЖД, ТЕТІ ЖСР 
BL28 28 Aa FE AT IB 

№ CS: APP 的 网 站 上 上 下载 文件 bufbomb.c, S815 8/8 ар X Pp. 在 bufbomb.e th, 你 会 
发 现下 面 的 函数 ; 
int getbufí) 
{ 


m 


char bufíl2]; 
qetxsibuf!; 
return 1; 


J 


void testi] 
10 | int val; 
11 print Í("Type Hex string:"]; 
12 val = getbuf í}; 
13 printfi("qgetbuf returned Ox&x^in", val); 
14 ] 
Ж getxs (也 在 bufbomb.c P) KATERN gets, Е/ГЕЕИОРХЯНЫ B] ЕШ Л zi uE 
AFARA. Hour. mice TET "0123", НАМФИАТЯН "30313233". XX 
数 会 忽略 空格 子 符 。 同 忆 К, РАСЕ х Н) ASCI 表示 为 Dx3x。 
这 个 程序 的 典型 执行 是 这 样 的 ; 
unix» /bufbomb 
Type Hex string: 20 31 32 33 
gekbuf returned Ох} 
ЖЖ getbuf KAPA, Ж БЕШ ҮЧИН S. ДЕШЕ ИН. CSR I. LEM 
БАН geuxs 没有 产生 效果 一 样 。 你 的 任务 是 ， 只 簿 单 地 对 提示 符 输入 一 个 适当 的 十 六 进 制 字符 串 ， 
ӨЛЕ getbuf 对 test 返回 -$59038737 (0xdeadbeef)， 
F 面 这 地 建议 可能 会 必 助 你 解决 这 个 问题 ; 
* H] OBJDUMP 创建 bufbomb 的 一 个 反 汇 编 版 本 ,性 细 研 究 ， 确 定 getbuf [ЖЕЙДЕ ПН 
的 ， 以 及 溢出 的 缓冲 区 会 如 何 改变 保存 的 程序 状态 。 

`. 在 QDB 下 运行 你 的 程序 。 在 getbuf 中 设置 -个 断 点 ， 并 运行 到 该 断 点 。 傅 定 像 名 ebp 的 值 
这 梓 的 参数 ， 以 及 已 保存 的 当 组 冲 区 谱 出 时 会 被 覆盖 的 所 有 状态 的 值 。 

` 于 十 作 定 指令 序列 的 字 节 编码 是 很 梧 燥 的 ， 而 且 容 易 出 错 ， 可 以 用 工具 来 完成 这 些 工作 ， 
写 一 个 汇编 代码 文件 ， 包 含 想 归 放 入 栈 中 的 指令 和 数据 ， 用 GCC ТУН, BER 
OBJDUMP БЇ se. ЖАРАН ЕЙ АЛЫШ АКЕЛУ РЕ] Г. 71 OBJDUMP 试图 反 
КЖ ЧЕЧЕН, mE GEN F E ER ЕРЕН, (BE yB) YAN 
该 是 正确 的 。 

要 记 仁 ， 你 的 攻击 是 非常 依 软 于 机 器 和 编译 器 的 , 当 运行 在 不 同 的 机 器 上 或 使 用 不 同 版 本 GCC 
时 ， 可 能 需要 改变 你 的 字符 串 。 


М DD ~ s Ln e æ [М 
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3.39 %ФФ 

用 asm ЖЫН -БРАЯШ MEEHAN: 

void full umul(unsigned x, unsigred y, unsigned dest[]); 

ТАЕ ЧО е 64 mega, ИА ТА HRA P. дезо AH fo 4 TE 
T. ТП dest ЕКЕН 4 TET. 

34) ФФ 

fscale 85187318 x у 的 函数 0877, ІХ RTZ ZR IRL 0 A Cround-toward-zero? ER 
Ж, ЖІ RASA, mp А. сае 的 参数 来 自 于 浮 点 寄存 器 栈 ，x Estot. ІП y 
Ф601 ЖЩ ЖЕНАНАФ(0, 小 弹 出 第 二 个 参数 , (K iB BUSES ЗЕН ДЕЛ RTZ(y) 
加 到 x МЕРЕЗ ) 

用 asm 实现 一 个 函数 ， 它 的 原型 为 

double scaleldouble x, int n, double *dest); 


TĦ fscale ТЕ ЖЫ E x 2°. AARRE HIRE dest ЗЕЕ АОВ В. 2 ЖМ asm XJ IA32 73 
м PF AS E REF. ЖА, ЯҺАНЫ, ФТ М ЖЕНЕКЕ ОА ЕҚ. 


练习 题 答案 


练习 题 3.1 答案 
这 个 练习 使 你 熟悉 各 种 操作 数 格式 。 


练习 题 3.2 EXE 

Шы) Lig E -种 理解 系统 的 好 方法 。 因 此 ， 我 们 想 要 逆转 CC 编译 器 的 效果 ， 来 确定 什么 样 的 安 
代 但 会 得 到 这 拌 的 汇编 代码 。 最 寻 的 方法 是 进行 “模拟 ”开始 时 ， 值 x、y Rz 本 别 在 指针 xp. ур 
和 zp 指定 歇 位 置 。 于 是 ,我 们 可 以 得 到 下 面 这 样 的 就 于 ; 

1 movi 8(%еор), %ед хр 


2 тоу] 12 (%ерр), %ерҳ ур 
3 movl 16 (ЖеБр),%езі zp 













202 %3% 
4 movl |%ейі),Феах x 
L movl ($ebx),*edx y 
6 movl {%ев1),%есх c 
? movl $eax, (%ebx) Зұр- x 
8 movl %ейх,{%ез51) кр = у 
9 movl Фесх, (%ед1) *Xp = 1 


ҤЕ ЙДЕ КЕ КПШ C 1548: 





code/asm/decode 1 -ans.c 
1 void decodellint *xp, int *yp, int *zp) 
2 d 
3 int tx = *xp; 
4 inL ty = ур; 
5 int iz = *zp; 
ü 
4 Жүр = Ех; 
日 *zp = tv; 
9 жұр = tz; 
10 ) 

code/asm/decode I-ans.c 
练习 题 3.3 答案 


这 个 练习 说 明了 leal 指令 的 多 样 性 ， 同 时 也 让 你 练习 解读 各 种 深 作 数 形式 。 注意 ， 虽 然 在 图 3.3 
中 有 的 操作 数 格 式 被 划分 为 “存储 器 ”类 型 ， 世 是 并 没有 访 存 此 生 ， 


Leal Bp (Seax) ,Sd 


leal |Зеах %есх ),%edx 


leal: ПхА{, %есх,4 |], Фейх 





leal ?#(%Жеах Зесх,2 Y, %6dx 


练习 题 3.4 答案 


这 个 练习 使 你 有 机 会 检验 你 对 操作 数 和 算术 指令 的 理解 。 
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练习 题 3.5 ЖЖ 
xr ER КАН EER АЛЫ, e eH E H GCC 生成 的 。 将 参数 n ШЕ (r 
器 名 ecx T, АЛЫ H ñi Sy НЕСІ 来 指定 sarl 指令 的 称 位 量 . 


1 movi l2(*ebp),€ecx Getn 

2 movi &{%ерр},%еах Get x 

3 sall 52, %еах x <<= 2 
4 sarl &cl,*eax Xx >>= h 
练习 题 3.6 答案 


这 人 小 指令 用 来 将 窗 存 邵 狗 edx 设置 为 0， 运 用 了 对 任意 x，x^X= 人 这 一 及 性 。 它 对 应 于 CC 语句 
1= 0, 
Хх ELR ОННАН) СУАР, МЕННЕН w HJ Wao Ba hp АНИ BAB. VA 
习惯 用 法 ， 是 成 为 阅读 汇编 代码 能 手 的 第 一 步 。 

练习 题 3.7 答案 

这 个 例子 吝 求 你 思考 不 同 拘 比较 和 set 指令 。 虹 注意 的 主要 问题 是 ， 如 果 将 比较 指令 一 这 的 奏 
强制 类 型 转换 成 了 unsigned. SE AB TEAM, edge p GT USE 


kz CE. 
1 char ctestí(int а, int b, int с) 
2 i 
3 char 11 = а < D; 
4 char t2 = b < (unsigned) а; 
5 char -3 = {short} С >= (short) а; 
5 char -4 = (chari a != (char) с: 
7 char t5 = C > ; 
Б char të = а > 0; 
9 return tl + t2 + t3 + td + t5 + t6; 
10 | 
练习 题 3.8 答案 


X& ^28 2] ЖИЕН ЕЛ AR Ps. 并 推理 出 跳 转 月 标的 编码 。 它 还 使 你 练习 了 十 六 进 制 算术 。 

A. jbe 指令 的 日 标 为 0x8048dlc + 0xda。 如 原始 反 汇 编 代码 所 示 ， 这 就 是 0x8048cf8。 

aD4Bdle: 76 da ibe 804B8cIB 

a048die: eb 24 jmp HQásdad4 

B. ДАП ЖЕКЕ, БЕ Н фы (ЖЕНИШ 0x8048d44。 根据 字 节 编码 ， 这 必须 是 在 超 
过 mov 指令 地 址 0х54 字 节 地 址 的 地 方 。 减 去 0x54 就 得 天 0x8048c 间 ， 反 汇编 代码 也 证 实 丁 这 一 点 ; 

BD4Bcee; eb 54 jmp BD3B344 

SÜ4BCFOU: c7 45 £8 10 00 mov 50х10,ОхЕІЕТІТГІН ЗеБр) 


C. На НХ Е 0x8048907 (пор 指令 的 地 直 ) 偏 移 量 为 000000cb 的 地 方 。 对 它们 求 和 就 得 
到 址 址 0x80489d2. 


204 $3* 


8048902; е9 cb 00 00 00 imp 80489d2 

8048507: 90 nop 

D. [ӨҢ Р HS Ru ff 25 kus. HERE UBER H БЕРУШІЛЕДЕН F TR 4 Tr HS 
ЖЫ. BIAIS АУА ЫНЫ ATEAC RJ NEFF Ж е0 a? 04 08. 

ҢПАВЗЕӘ: £f 25 еб a2 04 jmp *Оха04алеб 

BüUdBitb: ОВ 


练习 题 3.9 答案 
对 汇编 代码 写 注释 ， 以 及 模仿 它 的 控制 流 来 编写 C 代 吗 ， 旦 理解 汇 编 语言 程 序 很 好 的 手段。 水 
题 使 你 能 够 练习 - "个 具有 简单 控制 流 的 示例 。 它 还 给 你 了 -- 个 检查 逻辑 操作 实现 的 机 会 。 
A. 
— ———— code/asm/simple-if.c 


void condí(int a, int тр) 
{ 
it ip == Q) 
gote done; 
if (а <= 4) 
goto done; 
"D += а; 
done: 


| 


ыз іс -]o M &Q налы [pr 


—_ — DYA code/asm/simple-if.c 


B. 第 一 个 条 件 分 支 是 | 表达 式 实现 的 部分。 如 果 对 ІРЕК АШ. (CIE ФИО а>0 
的 测试 。 


练习 题 3.10 答案 

编 详 循环 产生 的 代码 可 能 会 难以 分 析 ， 对 为 编 详 器 会 对 循环 代码 进行 很 多 不 同 的 优化 ， 还 因为 
程序 变量 与 寄存 器 的 匹配 非常 困难 。 我 们 从 非常 简单 的 循环 并 始 练习 这 种 技能 。 

A. 只 要 看 看 是 如 和 何 取出 参数 的 ， 就 能 确定 寄存 器 的 使 用 。 





B. body-statement 部 分 是 由 С 代码 中 的 第 46 行 和 汇编 代码 中 的 第 6--8 行 组 成 的 。test-expr 
部 分 是 忆 代码 中 的 第 ? 行 。 存 汇编 代码 中 ， 必 是 由 第 9 一 14 行 的 指令 以 及 第 15 行 的 分 支 条 件 组 成 
的 。 

C. 如 了 注释 的 代码 是 这 样 的 ; 


initially x, у, and n are at offsets 8, 12, and 16 from %ebp 
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Put x in “езі 
Put y in ebx 


Put n in Фест 


Y t= H 


X += n 


Testn 

n > Ü 

Compara yin 
VÆNN 

п> Ü) & [y < n) 


Test least significant bir 


1 movl 8í$ebp),$esi 
2 movi 1213%eDbp),*ebx 
3 movl Ібрізеррі,%есх 
4 .pzalian 4,,7 

5 „L: loop: 
Š imull %есх,%ерх 

7 айа! *ecx,*es1 

ü decl %ecx n-- 

9 testl Жесх,Ж%есх 

10 setg %а1 

11 cmpl %есх,%еһрх 

12 setl %41 

13 andl Фейх,Ф%еах 

14 testb $1,*al 

15 ine .LB 


If != 0, goto loop 


ЕЕ, ШАХАЛАМЖЫН a be. THE, НРА НЕ (п>0) 和 (у<п) 只 可 能 
取 值 如 或 1， 因此 分 支 条 件 只 需 测 试 它们 AND 的 最 低 字 节 。 编 译 器 还 可 以 更 聪明 一 点 ， 用 testb TH 


今 来 执行 AND HE, 
练习 题 3.11 管 案 


这 个 问题 提供 了 驴 外 一 种 机 会 来 练习 解读 循环 代码 。C 编译 器 做 了 一 些 有 去 的 优化 。 
А. 有 看 参数 是 邵 何 电 出 的 ， 以 及 寄存 器 是 旭 何 志 始 化 的 ， 就 能 确定 二 人 存 器 的 使 用 ， 





B. test-expr 出 现在 它 代 码 的 第 5 行 ,汇编 代码 的 第 1047 UL. ПТВ Е body-statement 
出 现在 忆 代码 的 第 6—8 fr. 汇编 代码 的 第 7 一 9 行 。 编 译 器 发 现 while 循环 的 初始 测试 总 是 为 真 的 ， 


RHA REUE REEDE 256. 


C. 加 了 注释 的 代码 是 这 样 的 ; 


хок, %ecx,kecx 


> ім B3 F 


movi Чеах,Жейх 


movl В{%еһрр) ,$eax 
movi l2(*&ebp),.t*ebx 


Put à in %епх 
Put b in ерх 
1 = 0 


result = a 
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d in Феах, b in ebx, iin %есх, result in бедах 


5 .pzZalign 4,,7 
5 .L5: 

7 addl £eax, едх 
8 subl %ерҳ, %еах 
9 addl ерх, жесх 
10 cmpl 5455, зесх 
11 jle .L5 

12 movl Фейх, %еах 


D， 等 价 的 goto 代码 是 ; 


loop: 


result += a 
ü--b 

i+= b 
Compare 1:255 
If <= goto. Ipop 


Set resul! as return value 


int loop while gozot(int a, int b) 


{ 
int 1 = 0; 


int result = a; 


1 

2 

3 

4 

5 Loop: 
Б result += а; 

7 a -= Б; 

ü 1 += b; 

9 if {1 <= 255) 
10 go:o loop; 
11 return result; 
l2 f 


练习 题 3.12 答案 


种 分 析 汇 编 代码 的 方法 是 试 者 逆转 编译 过 程 ， 牛 成 对 C 程序 员 来 涪 看 起 来 比较 “自然 的 ”C 
ТЫ Slip. ЖПЛӘМЕЛІ goto 语句 ， 因 为 它 在 C 中 很 少 使 用 。 很 有 可 能 我 们 也 不 使 用 do-while 
语句 。 这 个 练习 迅 使 你 将 编译 道 转 威 某 和 框架 。 它 要 求 思 尊 for MARRY. CERRI -种 称 为 
代码 移动 (code motion) 的 优化 技术 ， 也 就 是 当 可 以 确定 让 算 结 果 在 循环 中 不 会 改变 时 ， 将 计算 从 


循环 中 拿 出 来 。 


А. 我 们 而 以 看 出 result 必须 在 寄存 器 区 eax фр. 初始 化 时 它 被 置 为 0， 循 玉 结 束 时 留 在 和 eax 
中 作为 返回 介 。 我 们 可 以 看 到 i 保存 在 寄存 器 Redx H, BLAU SE AER FEE D PE AIC ERE CA E 


йш» 


В. 32-441 МЕ beds W B n-1. 
C. 第 $ 行 和 第 12 行 的 测试 要 求 1 非 负 。 


D. 2:8 i 被 指令 4 减 小 . 


E. 指令 1. 6 17 4815 x*v 存 赃 在 寄存 器 %eex H, 
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і int loopíint x, ant y, inb n) 

2 1 

3 int reéesilit = 0; 

Д -nt 1; 

5 for {1 = n-1; i >= б; 1 = i-x} I 
Š reguli += v * x; 

1 | 

» return result; 

3 ] 


练习 题 3.13 答案 

这 个 续 习 六 你 能 够 推算 出 开关 语句 的 控制 流 ， 回答 这 些 问 题 要 求 你 将 汇编 代码 中 的 志 处 信息 纤 
合 起 来 : 

l. 汇编 代 负 的 第 2 行将 x 如 上 2， 以 将 情况 tcases》 的 下 界 设 壮 成 0。 这 就 意味 着 最 小 的 情况 
标号 (саѕе lable) 5-2. 

2， 当 调整 过 的 情况 值 大 了 6 时 ， 第 3 行 和 第 4 行 会 恒 鸭 程序 跳 转 到 默认 情况 。 这 就 意味 看 城 大 
情况 标号 为 -2+6=4。 

3. П.В, RIASACH Aiie- D ШИЮ CLIO 与 第 44 行 的 跳 转 指令 的 日 
号 一 样 ， 表 明 这 是 默认 情况 行为 ， 因 此， 在 开关 语 他 体 中 缺失 了 情况 标号 -1。 

4, НЬ, RIASA S 和 第 6 个 表 项 的 日 的 -- 样 。 这 对 应 于 情况 标号 2 和 3。 

从 土 述 推理 ， 我 们 得 到 两 个 结论 : 

А. 开关 诺 本 体 中 的 情况 标号 值 为 -2、0、1、2、3 和 4， 

B. 日 标 为 L8 的 情况 标号 为 2 和 3。 


练 可 题 3.14 答案 


Ж МИ КШ НЕ. 刚 开 始 , 它 看 起 来 非常 奇怪 一 一 call 指令 没有 与 之 匹配 的 ret. 
ЯА AE А ТЕН ЖЕ Ж -个 真正 的 过 程 调用 。 
А. Феах ЖИ ЕЛУ popl 指令 的 地 址 。 


B. 这 涉 是 一 个 真正 的 子 过 黎 调 用 , 因为 控制 蚌 按照 与 指令 相同 的 项 序 进 行 的 , 而 返回 值 是 从 栈 
中 弹出 的 。 


C. 这 是 IA32 中 将 程序 计数 器 的 值 放 到 整数 寄存 器 中 的 惟一 方法 。 

练习 题 3.15 答案 

这 个 终 习 使 得 对 寄 由 器 司 用 规则 的 讨论 具体 化 。 寄 在 器 名 edi、 名 esi ЖІФерһх 是 被 调用 者 保存 的 ， 
仔 改 变 它们 的 值 之 前 ， 过 程 必 须 将 它们 保存 在 栈 中 ， 在 返回 之 前 ， 要 恢复 它们 。 其 他 . -个 寄存 器 是 
Л] ж ЖЇН. ИТ К ЖОНУН ЖЕНІЛ. 

练习 题 316 ЖЖ 

НЕЗ ЛЕТ РА CR Df RARD. БЕЙНЕ Л ЛЕ {АЫ ЕН Aa. Fx 
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的 那样 ， 继 详 器 分 各 7 了 大量 根 本 不 会 使 用 的 空间 ， 

А. Ж, Фезр 的 值 为 Ox800040。 第 2 行将 这 个 值 减 了 4, 得 到 0x80003C, ОД T Stebp 
的 新 值 。 

В. 我 们 可 以 看 到 两 个 leal 指令 是 如 何 计 算 要 传 给 scant 的 参数 的 。 因 为 参数 要 以 相 扩 的 顺序 压 
Ath, BALLER] x 位 于 要 对 于 人 ebp 偏 移 量 为 -4 的 地 方 ， 而 了 在 偏 移 量 为 -8 的 地 方 。 因 此 二 
们 的 地 址 是 0x800038 AI 0х800034. 

C. 乒 指 针 的 初始 值 为 0x800040, 5211Ж 4. 第 4 行将 它 减 了 24, mA SITRER | 4. 
二 个 入 栈 指令 将 它 减 了 12， 上 总 共 减 小 了 44. Eit. Æ 101E wesp 等 于 0x800014. 

D. 栈 帧 的 结构 和 内 容 如 下 : 


Пх800060 |4— ізге 
Üx53 |х 






Пх800бзС 


ЕСІМЕ 





058000134 
Пх800030 
AXARINI 
0x5 00026 
СВ 24 
nxabanaio 
Ox&Dnücoic 


Сеа 0918 Ox800014 


баба 0300070 |4-—- +250 


E. 0х800020--0х800033 J Ti д ӨЛІ. 


练习 题 3.17 Ж 
jx 1 1 o Hoe АЛИЯ ЕЛІНЕН. ЕЕ, EREHE 4 ЕЛІК. long 
double 的 GCC 实现 用 了 12 AF т ЖЕБЕШ, ИЕ АНЕ 10 ЕТ. 


心太 小 起 始 地 址 us. i 
28 A 





练习 题 3.18 答案 
这 个 续 习 是 大 地 整数 数组 所 的 练习 的 一 个 变形 。 理解 指 针 与 指针 指向 的 对 象 之 间 的 区 刘 是 很 重 
要 的 。 因 为 数据 类 开 short 需要 2 个 字 节 ， 记 以 所 有 的 数组 索引 都 将 狐 以 内 子 2。 前 面 我 们 用 的 总 


шоу], Hd Rim movw. 


от * х +2 
short Мх +6] 


skort Xn +2ї 


akort M[ xz 8/42] 
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lea. /|Жейкх!, ЖеаХ 
шоуы БіЗегіх!, Фах 
leal {fedx, Жесх,2),Фаах 


movw 2i*edx,*$ecx,8],€aàx 





short * X- +H- 10 


5 5% 3.19 答案 
这 个 练习 要 求 你 完成 缩放 指令 ， 来 确定 地 址 的 计算 ， 并 且 应 用 行 优 先 索 引 的 公式 。 第 PEH 


妓 汇 编 代码 ， 来 确定 如 何 计算 地 址 引用 : 


movl В{%Жеһр) ,%#есх 


Qu o -1 М ІЛ gu іс у Lr 


leal 


leal 


mew l 
агісі1 


моу] 12(%еррі,%*еах 
0{, %еах, 4), %ерх 
01, жесх, Ё), едх 
subl Фесх, Eedx 
add] ®еһх,%еах 
sall 52, Жеах 


Іва. -10 (Фейх, жесх, 2) %еаҳә5 


5%) 
20% 


mat? (keax,%ecx,4) Seax та{(20* + 4*iy4] 
тас! {$%ebx, Sedx, 4}, #еах + тая + 28%у4) 


ВЕЗЕ S tH, ЖЕЕ mat 的 引用 是 在 字 节 偏 移 ARRA. ПА mat2 的 引用 是 
ЕЗІ АСА. ARIP отап 479), ІП ma2 A 597), #MAJ M=5 和 №7. 


练习 题 3.20 答案 

这个 练习 要求 你 研究 并 . 锋 代 码 ， 理 解 是 如 何 优 化 它 的 。 对 提高 程序 性 能 来 说 ， 这 是 一 项 很 重要 
НУ НЕ АЛЕ ЖАЛАҚЫНЫ, АПАН ЕЕ АНА НЕ. 

Pn C ТИН ИА ИІН Ж: 


+ Set ali diagonal elements to val %/ 


int cnt = H-1: 


*Aptr = val; 
Арт 一 三 [N+1] : 


-nbt--; 


võid fix set diag орі (ёх matrix A, int val) 


int *Aptr = БА[01 [0 + 255; 
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10 ; while (cut >= 01; 


通过 下 面 的 注释 可 以 看 上 出 它 与 汇编 代码 的 六 系 ; 


1 movl 12[%еЬр) ,$edx Get val! 

2 movl В{%ерр) ,%еах Get А 

É movl 515,%есх i= 0 

4 addi 51020, %еах Aptr = AIONO] + 1020/4 
D .p2a.ign 4,,7 

5 ‚150: loop: 

7 movl Фейх, (keax) *Ápir = val 

d addi 5-68, %еах Apir -= 68/4 

9 decl %есх i- 

10 jns LSC ifi >= 0 poto loop 


TEE Ad ЕН ДЕШН У, ЖН s EE IER ER а TIERS. ЕНЕНЕ Л 68 (=17.4)， 因 为 数组 
ЖЖ A[i-1]li- ПЯ 和 器 国之 间隔 着 N+1 个 元 素 。 
练习 题 3.21 答案 
这 个 练习 让 你 思 着 续 构 布局 ， 以 及 用 来 访问 结构 的 域 的 代 公 。 该 结构 声明 是 交 中 所 水 枫 隆 狗 ` 
个 变形 ， 它 表明 磋 套 的 结构 的 分 配 是 将 内 层 结构 巍 入 到 外 层 结构 之 中 的 。 
А 结构 的 布局 图 是 这 样 的 ; 
RE Ü 4 8 12 


d 


B. V BHTI16^ zi. 
C 邮 平 时 一样 ， 我 们 从 给 汇编 代码 加 注释 开始 ， 


1 rovl 8(%ерр],%еах Get sp 

2 movl 8{%еах},%ейх (ге! 5р->5.у 

3 movi Фейх, 4(%еах) Сору to 5р->5.ҳ 
4 leal á($Seax),$edx Get &(sp-23.x) 
5 movl Sedx, (Феах) Copy to 5p-»p 
ñ movl $eax,l2í($*eax) sp->next = p 


HIE, ETIB CAER F C АИ: 


void sp initi(struct prob *sp) 


Gp--89.Xx = BDp-25.Yy; 


吕方 一 > 站 = KA SP->8 x; 
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练习 题 3.22 答案 
这 是 一 个 很 丽 手 的 问题 . 它 将 对 以 猜谜 技术 作为 逆 问 工程 的 一 部 分 的 需求 提升 划 了 “个 新 站 度 。 
蕊 清晰 地 表明 ， 联 合 是 一 种 将 争 个 名 宁 和 类 型 ) 与 单个 存储 位 管 联 系 到 一 起 的 阐 单 方法 。 
A. 职 合 多 布 局 如 下 面 所 小 。 正 如 这 上 张 表 说 明 的 政 样 ， 这 个 联合 既 可 以 解释 为 “el”( 有 域 el 
相 el,y)， 也 可 以 解释 为 “e2”( 有 域 e2,x M e2.next)。 
ЕЕ 0 4 
БЕ el.p el y 


B. СЕЛЕН ГВА, 

C. JEH A, ЖАПАЙ Ж ТЕШЕ EOF. (Oil h, 90385, ВН 
Жа, ШЕШ he S RARE. ИШ. #2111 ЕЛИЗЛАД Ж ely, E 
п] ЙЯ FE pak HY л. Ж e2.next.. (3830. АТА Н АЈА as SUR Jy АЖА ТЫҒЫ, PH 
以 只 可 能 是 第 一 种 解释 了 。 


1 movl 8[*ebp),$eax  QGetup 

2 movi 4(%еах), Фейх ap-»el.ví(no) or up-»e2.next 

3 movl {ебх}, %есх up-»e2.next-»el.p or up-»-e2,next-2e2.x (no) 
4 movl {Феах),жеах up->el.p (nol or ир->е2.х 

5 mov] ($ecx),£ecx *up-»22.next-»el.p) 

5 subi %еах,%есх *(up-»e2.next--el.p) - ир->ед.х 

7 movl *ecx,4(tedx) — Stereinup-»2e2,next-»el.vy 


由 此 ， 我 们 可 以 产生 如 下 C feta. 


void proc (union ele *up) 
[ 


up-»e2,.nexLt-»el.y = *(iup-»e2.next-»el.p] - up-»e2,.x; 


} 


练习 题 3.23 答案 
计 理 解 各 种 数据 站 构 嘴 要 多 少 存储 ， 凡 六 对 理解 编 详 器 为 访问 这 些 结构 产生 的 代码 来 说 ， 理 解 
结构 布局 和 半 齐 荐 廿 常 重要 的 。 这 个 练习 计 你 看 清楚 一 些 示 例 结构 的 细节 


А. struct Pl { int i; char c; char d; int j; 1; 
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B. struct P2 í int i; char c; char d; int J): H: 





C, struct P3 { short w.3]; char c[3] ; 





D. struct РА { short w 3]; char *c[3] i: 





E. struct P? { struct Pl a[2]; struct P2 *P i; 





练习 题 3.24 答案 

ДА Т [| E пт} isa 2, ИШ, ЕРЕЖЕ. АЅСП В ЛДЕ. СНВ 
fisso. Ж Kaha И тШ A HU. 

А. ТТҚ. 


ij: [R| Hh НЕ 
{ТЕГ bepp 4— ФеБр 
рц 14-7] 


wf D-i! 


Ud besi 
ЇЕ] &ebx 





xz [uith ht 
EFE] tebp *— &ebp 
buz[4-7; 


bu£[ü-i! 





C. KETAR EPEHA 0x08048600， 低 位 字 节 被 结尾 的 空 (D 字符 覆盖 了 ， 
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D. {ЖЕ Sr fr Феһр ТИҢ ЗЕН Т 0x31303938. 56 getline KEZA FK Au ES (ç 


器 中 。 剑 仓 的 其 他 寄存 器 不 受 影 响 ， 因 为 它们 保存 在 乒 中 比 buf 更 低 的 地 址 上 。 


E. 对 malloc АЛЯ Р А sirlen(buf)+1 ТЕГЕН, ШПЕАРНАН АОБ ВИЕ e УЗ ЕЕ. 


ы 3.25 ЕЖ 
这 个 练习 使 你 有 机 会 试 试 3.14.2 节 中 描述 的 道 归 过 程 ， 
2 load b ist (1) 
| b SELD} 
3  multp èst (0) 
4 1о4 a &st (1) 
[o8 58000) 
6 пес &st (0) 
7 load с &scil) 
ist (0) 
` doni h tst (2) 
зс 
一 o] месі 
4 load a Бег (3) 
БГ (2) 
atil] 
$stiü) 
10  multp *st (2) 
st (1) 
第 St 0) 
11  divp st (1} 
kst (O) 
13  mulLp st {D1 
22 S3torep x 
练习 题 3.26 答案 


КАВИ E APER ИР “个 测 试 结果 从 两 个 值 中 进行 选择 产生 的 代 友 相似 : 


1 
" 





test %еах, teax 


Я 





214 %1% 
4 jump 1,9 
5 Lll: 
? ИЕ 
f SI TPERUELE: x а: b. 
练习 题 3.27 答案 


出 于 仑 的 关于 弹出 操作 数 的 规则 ， 以 及 参数 的 顺序 等 等 ， 浮 点 代码 非常 礁 处 理 . 这 个 练习 使 你 
有 机 会 完整 地 完成 一 些 特殊 本 况 ， 


2 паа | Ob — | sst(l) 
| | 8 | Ssst(0) 

2 ілш) |o 0» | šti 
èst (0) 

d Zych | с-ф %st (1) 
i b st {0} 

5 Edivrl ç tst (1) 
ci b &sr(0] 





Estp x 
这 段 导 友 计 算 的 是 表达 碟 x=a*b-c/b. 


练习 题 3.28 ЕЖ 
К) ДОЙ АЛЕТ А КАО АЕНА ЕСН ДМ, 





code/asmfphunct2-ans.c 
1 doubie funct2Z(int а, double x, float b, float 1) 


[ 


^] 


return a/ix«b) - 12.1): 
4 | 


Е 


—— coderasm/fplunct2-ans.c 
练习 题 329 答案 

(E95 4 TERIS 5 4727 fH] A, КУКЫ. 

l спро 51,%ah Test if comparison outcome is < 


练习 题 3.30 ЖЖ 


І int ok,smuliint x, int y, int -*dest) 
2 Í 


125 a5 3.25 4 £ = 


long long prod = (long long) x * v; 


int trunco = {int} prod; 


*dest = trunco; 


return (brung == prod]; 
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НТ АМЕ Жыя] БИЕ А ПЕНЕН АЙЫ) a РНН DEER k п) 
容纳 一 个 元 整 的 向 性 能 处 理 跨 和 大 的 高 速 缓 存 ， 以 及 用 来 连接 外 部 设备 的 膛 和 输电 路 。 从 性 能 二 来 说 ， 
ARE HBA ESRB ARES Ct b 20 后 前 价值 1000 万 美元 、 有 房间 那么 大 的 起 级 计算 机 相形 
МІ. НИЕТА. ТАЖ ТЕН EGRE ПИХТА EDGE ЕТ ИНКА АЛДЕ. НН. 
АЕА РНЕК SR A E. 

A EE dos ЗИП RU r eL А РА Е ЕНЕ. RARE ЛАН А MIA T 系列 
fE^. ЗАРУ ВАТИ ЕЕ, PETER. ЕЭ GS res # ZF Ү a PF ЭЦ pk Bj 
МИЧ EIN. “АРА X БУНИН? TUB НТ ШЛЕМ ISA Cnstructionset architecture. 
指令 集体 系 结构 ), 不 辐 的 处 理 器 " 家族” 例如 Intel TA32 .IBM/Motorola PowerPC 和 Sun Microsystems 
SPARC. WATER 本 A。 一 个 程序 编译 成 在 -种 机 器 上 运行 ， 就 不 能 硅 另 一 种 机 器 上 运行 : 另外 ， 
同一 个 家 族 早 也 有 有 很 多 不 同类 型 的 处 理事 。 嚼 然 每 个 | mise] RSSRTESERI M ЖЕЛЕ ЫЫ TH 
АЛУА АНЕ ISA 级 别 | 部 保持 着 兼容 。 CES NIFI SERERE ER СӨЛІ 1А32) "ВАН ДЕР 3 EH 
多 个 上 商 提 供 。 因 此 ，ISA (РА МАН GR K Л ВЕЕ y CODES. ЕШ 
ВУЙ ЕНІН ЛИЕ». DAE una Bat; АКА ТУА Pd due mI 
АН. 

Ж ЖЕ ИОН ИЕН СЫ RIERA -个 硬件 系统 执行 某 种 ISA 指令 的 方式 ， 这 会 
ИЛНЕ RC ИЕЛЕН 上 作 的 ， 以 及 计算 机 制造 商 们 面临 的 技术 挑 成 ， T TREE RESS 
三 是 击 代 处 姬 器 的 实际 工作 方式 可 能 跟 ISA 隐 省 的 计算 模型 人 相 径 庭 。ISA 模型 看 六 去 庶 访 是 顺序 
指令 执行 ， 也 就 是 先 取 出 一 条 指令 ， 等 到 它 执 行 完 毕 ， 再 开 如 下 一 条 。 然 而 ， 与 一 个 时 刻 只 执行 一 
条 指令 相 比 ， 通 过 问 时 处 征 多 条 指令 的 不 同 部 分 ， 处 理 器 可 以 获得 较 高 的 性 能 ， 为 了 保证 处 理 器 能 
fele FRIES. A DERI 些 特 殊 的 机 制 。 在 计算 机 科学 中 ， 用 蕊 隶 的 方法 在 提高 
БЕНЕН. МЇ 一 个 更 简单 、 更 抽 乱 模型 的 功能 的 思想 是 杂 所 周知 的 , 在 Web | 38 Ру 
一 交 树 和 哈 希 圾 这 样 的 信息 控 索 数据 结构 中 使 用 缓存 ， 就 是 这 样 的 例子 。 

你 很 可 能 水 远 部 不 会 自己 设计 处 型 器 。 这 是 专家 们 的 任务 ， 他 们 [ 作 在 全 球 不 天 100 家 的 公司 
H. SATA RICE IER UT? 

. ACRI Gn Kb, Ab ӘЗ А ES 4E SS. ЕЛӨН ЕРТЕ AAE HB i 

х XI HE. ПЕЛНЕМЕНЕІ ЕДИ ЕЖЕ ГЕРА я а ЖӘ C 
SWISS LERE, FESUE R£ N ABAE 4 ТИ. Н УУ БЫШ ЕНІН ЕЕ 
BB. eh L ER M ЯЗУГА, Шуй М ERI BERI. 

. РОТ ДОЙ Г LEG ЗИ S H N PUS SA e ELEM. dU 6 章 中 ， 我 们 将 
济 述 仓储 器 Cmemory ) SZ EL ЖН ЖЁ! ЖЇН K WAE h 2e nh АЈА УА RR ЫМШ Ж. 
ЖАЛАҢ АН IEEE S —4E fi sa e Ll e IP UB А ШИ. 

e ARUS AILEE. ДВ ARH ӨФАНАНЯНЯРАН, ЖАКЫН ЖЕ A USE EA 
系统 路， 如 汽车 和 家 用 电器 ， 己 经 变 得 -非常 普通 了 。 嵌 入 式 系 统 钓 设计 者 必须 了 解 处 理 跨 
号 区 何 工作 的 ， 因 为 这 些 系统 通常 是 在 比 毕 面 系统 更 低 抽象 级 别 上 进行 设计 和 编 各 的 。 

e 你 的 工作 可 能 就 是 处 理 器 设计 。 虽然 生 产 处 理 器 的 公司 很 少 ， 人 是 妍 究 处 理 器 的 说 计 大 员 
AFCA KRT, WHARA., AER RAER ИТЕК AA iA Д 3] 800 
$. 
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жат, RB XE X8 EISE. ЛЕЕВ ЗЕР На flm PM. |H 22 EI 
[A32 #905. ШЕХУ "X86". АТЫГАЕВ RA “Ү86” i3 SR. 43 IA32 
НЕ, ҮЗЫНА АЛ, BH ug Wap r5, MT ПӘННЕН КЕНЕ. Jo. 
КАР, IRIE EL ABRE ЕЕЕ. EVE T SCR, Y86 АН ЕЖЕЛГІ 
ЖҮРЕ ИНЕНІҢ ЖЫ n] 88, 

搓 卡 来 我 们 会 提供 一 毕 数 字 硬 件 设 计 的 背景 。 我 们 会 描述 处 理 器 中 使 用 的 基本 构件 块 ， 以 豚 它 
们 是 如 何 连 接 起 来 和 操作 的 。 这 些 介 绍 是 建立 在 第 2 章 对 布尔 代数 和 位 操作 的 讨论 的 基础 上 的 。 我 
们 还 将 介绍 一 种 括 述 硬件 系统 算 制 部 分 的 简单 语言 ，HCL (Hardware Control Language, WEHE lin 
言 )。 过 后 ,我 们 会 用 它 来 描述 我 们 的 处 理 器 没 计 。 即 使 你 已 经 有 了 x9 kur BU ЛИШ. UM 
И T A621 0L ТИПИ АЕ. 

ЕЕЕ ДЯ cb, ТЗН ХЕ ЕЛЕД ВЕ. ІЛІНІП ЕЛІ АЛЕН? Y86 处 理 
5. XX ERES ART TENEAT Н) vsodt o. ВТЕ hi ah p darte. Ely T 
周期 内 完成 所 有 的 动作 。 ЕКА ДЕНГЕ ЗЕК. (H RE КЕНЕ Su ECT RR HEP UR Be ¿5 
到 的 性 能 。 

以 这 个 肪 序 设计 为 基础 , 我 们 进行 一 些 卜 造 , 创建 “个 流水 线 化 的 处 理 器 (pipelined processor). 
这 个 处 理 器 将 每 条 指令 的 执行 分 解 成 五 步 ,每 个 步骤 由 - 个 独立 的 硬件 部 分 或 阶段 (stage) ЖАШ. 
指令 步 经 流水 线 的 各 个 阶段 ， 旦 每 个 时 钟 周 期 有 一 条 新 指令 进入 流水 线 。 所 以 ， 处 理 器 可 以 回 时 栅 
行 五 条 指令 的 不 同 阶段 ， 为 了 使 这 全 处 理 器 保留 了 86 ISA 的 顺序 的 性 质 ， 就 要 求 处 理 很 多 冒险 或 冲 
X (hazard) 条 件 。 表 险 就 是 一 条 指令 的 位 置 或 操作 数 依 赖 于 其 他 仍 在 流水 线 中 的 指令 。 

我 们 设计 了 一 些 工 基 来 研究 和 测试 我 们 的 处 理 器 设计 。 其 中 包括 Y86 ҰИА. АННА E 
11) ҮЛДЫ, EAE AA ТИНЕ SR VERI УК E OA BER ЕТЕ ДАР. lE 
BW КИШИ Н ЕЛЕН HCL Т} 9S ІН x TET ui). ЛАН АЕ c PRI E NETUS. 你 可 
以 改变 和 扩展 模拟 行为 。 我 们 还 提供 许 名 练习 ， 和 包括 实现 新 的 指令 和 修改 机 器 处 理 指 令 的 方式 ， 还 
提供 测试 代 公 以 带 助 你 评价 你 修改 的 正确 性 ， 这 些 绒 习 将 极 大 地 帮助 你 理解 所 有 这 些 内 容 ， 也 能 使 
你 揭 理 解 处 理 器 设计 者 面临 的 许多 不 同 的 设计 选择 ， 
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如 图 4.1 Атк, Ү86 程序 中 的 每 条 指令 都 会 读 取 或 修改 处 理 器 状态 的 某 些 部 分 。 这 称 为 程序 员 
可 兄 状 态 ， 这 里 的 “程序 员 ” 既 措 用 汇编 代码 写 程 序 的 人 ， 也 包括 产生 机 器 级 代码 的 编 详 器 ， 在 我 
们 的 处 理 器 实现 中 ， 只 要 我 们 能 保证 机 器 级 称 序 能 够 访问 程序 员 可 见 状态 ， 就 不 需要 完全 按照 ISA 
隐 全 的 方式 来 才 小 和 组 织 这 个 处 理 器 状态 。Y86 的 处 理 器 状态 类 似 于 IA32。 有 八 个 程序 寄存 器 ; 
Феах. Фесх. Фейх. Феһх. Hesi, ейі. %евр 和 %ebp， 椒 理 占 每 个 程序 寄存 器 存储 一 个 仓 。 宫 
存 器 和 esp 被 入 模 、 出 栈 、 凋 用 和 返回 指令 作为 栈 指 针 。 而 其 他 寄存 器 没有 尚 定 的 含义 成 固定 值 。 有 
二 个 一 位 的 条 件 码 ，2ZF、SF 和 OF， 它 们 保存 着 有 关 最 近 的 算术 成 逻辑 指令 造成 影响 的 信息 ， 程 序 
计数 器 (РС) 里 存放 着 当前 正在 执行 指令 的 地 址 。 存 鳍 器 ， 从 概念 上 来 说 就 是 -个 很 大 的 字 节 数组 ， 
保存 着 程序 和 数据 。Y86 程序 用 虚拟 地 址 来 引用 存 赃 器 位 置 。 硬 件 和 操作 系统 软件 联合 起 来 将 虚拟 
地址 拓 详 成 指明 效 据 实际 存在 存 情 器 中 电 个 地 方 的 实际 或 物理 地 丝 。 我 们 还 将 在 第 10 РВЕ bie 
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ЖЕЛЕНИ ЯВ. ӘУЕ, ИП АА SRA RR Sa tas Y86 程序 一 个 统一 的 字 HERR (RS 
EF d ES 存储 器 
жіне 


PC 


41 Y86 程序 员 可 见 状态 
[]IA32 -HP Yes Е ТАРУ НРО ТЕ. РЕНА. ЕЕЕ Е ГРС НЫ ИЕ. 


图 4.2 给 出 了 YR6 ISA 中 各 个 带 令 的 简单 措 述 。 这 个 指令 集 就 是 我 们 处 理 跨 实现 的 日 标 。Y86 
指 今 集 基 本 上 是 IA32 指令 集 的 ГА. ПАДУ Е, Эр, ВЕ 
少 。 央 为 我 们 只 有 由 子 节 数据 ， MARZA "F woad)” 在 这 个 疼 中 ， 丰 边 是 指令 的 汇编 公 表 水 ， 
hu fy hs, T RIA LA32 程序 的 GAS 表示 UTER, 


r= 11 


Fi 0 1 2 3 4 5 


гор 





halt 


UA 
m—* БЕТ 


"a 
jxx Dest p jmj Oe 
anot [а 
ret 

push) ГА 
popl ГА 


图 42 Y86 指令 集 
НЩ ТЕТ АУТА. :条 指令 含有 一 个 单字 节 的 指令 指示 符 ， 吕 能 售 有 个 单字 节 的 寄存 器 指示 符 ， 还 


ТЕЕ" МИНУР. А а ЗН ЕВГ СОРОХ ЕКЙ ХАН CODO. Boer te d РУЛЫ 
Жк 
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КЕДЕН] Y86 IR J Ж ЯТУ. 
е JA32BJmovl НӘ FU 8] 5: irmovl. rrmovl. mrmovl ЖІ rmmovl, 227 X 
ИИ НАЖ H ША. Wan ДЕУ CO. ATR (r) БҰНЫ (m). 12 ЯВ 
-修学 母 就 表明 T URBE. НЕГЫ ДЕ a 8 (ЖЕ (m), Ba TH ТТ 
НИЕНІ НЕЕ, ЖЕНА ЫЗ ДЕЛІК, EAE НН E DS haw UU RE ЖЕЛ! E (8 8 
帮助 的 。 
PR P Ти л ТЕБИП ТАЕНЕ 0 L7 ДЕНЕНІН ЖЫ ma Ёл. Ou BET ЯТ. 
我 们 不 支持 第 一 变 扯 寄存 器 (second index register) 和 仔 何 寄存 器 值 的 促销 (санар). 
5]1А32 -%, ШИЕ A qp HS BE АВА е RH BE. 5B. 3 
(НВ A ЖҮР r R t Ag eE SR. 
. ТД TEB 2. XERIA2 中 的 OP1。 它 们 是 addi. subl, andi хол, "tz d] REA 
仔 吴 数据 进行 操作 ， 而 IA32 efi eee ARCET CENE. vus PLUS PX 
t$ ZF. SF 和 OF GE, RES REB). 
е ЖЕФ (图 42 中 的 jxx) Æ jmp. je, jl. je. іле. jge jg. 根据 分 支 指令 的 类 型 
HRR А REETA. AERA A B FE CBE 3.112。 
е call 指 今 将 退回 地 址 入 栈 ， 然 后 跳 天 有 日 的 地 址 。ret 指令 从 这 样 的 过 程 调 用 中 返 澡 ， 
“ push 和 pop] 指令 实现 了 入 酰 和 出 栈 ， 就 像 在 1&32 中 HE. 
* halt 指令 停止 指令 的 执行 。IA32 中 有 一 个 与 之 相当 的 指令 ， 时 hit. 1432 的 应 用 程序 不 多 
许 使 用 这 条 指令 ， 因 为 它 会 导致 整个 系统 停止 。 我 们 在 Y86 理 序 中 用 һай 指令 来 停止 模拟 
器 。 
图 4.2 还 给 出 了 指令 的 字 节 级 编码 ， 取决 十 需要 那些 字段 ,每 条 指令 需 豆 1 一 6 个 字 节 不 等 。 每 
条 指令 的 第 一 个 衬 节 表明 指令 的 类 型 。 这 个 字 节 分 为 两 个 部 分 ， 每 部 分 四 位 ， ЦА ДА (code) 
部 人 外， 低下 位 是 功能 (funcion) War. 1 4.2 Кл, {АШИ 0—B CTONXEBD. ДЕМЕН Е 
一 组 相关 指令 共用 -个 代码 时 才 有 用 。 图 4.3 给 出 了 整数 扎 作 和 分 支 指 令 的 具体 编码 。 


хі? 


图 4.3 Y86 指令 集 的 功能 码 
这 些 代码 指明 是 某 个 赣 教 所 作 还 是 分 上 条件。 这 些 指令 是 图 42 中 所 示 的 DPI fa ХХ. 


ARE 4.4 Вг, FER REESE REI IERI] 0-7 М-Ж (терімег ID). Ү86 中 
WIR eei ib SR [A32 中 的 相同 。 程 序 寄存 嚣 被 存在 CPU 中 的 一 个 寄存 器 文件 中 ， 这 个 寄存 器 文件 
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ЖЕ E. ОНҒА ID TED EBERT ЛИЛ in] E6838. ID (& 8 用 于 指令 编码 中 ， 在 我 们 的 硬件 
设计 中 ， 当 需要 指明 不 应 访问 性 何 寄存 器 时 ， 我 们 就 用 这 个 值 来 表 术 ， 





Ü 
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图 4.4 Y86 程序 寄存 器 标识 符 
八 个 程序 寄存器 中 每 个 都 有 ”个 相对 应 的 标识 符 《ID)，0-…7。 如 果 尼 令 中 某 个 寄存 器 字段 的 情 为 ID 8， 就 老 明 此 处 没有 寄主 
AER. 


TJ CERES md dde ВЕЕ ABAE kE. Sx. ug Ng 
dagadt T P (register specifier byte), RE 一 个 成 两 个 寄存 器 。 在 图 420, ХЕ {ГУР 
为 I 几 和 了 IB。 从 指令 的 汇编 代码 老人 小 中 可 以 看 到 ， 根 据 指 令 类 型 ， 指 令 叮 以 指定 用 TOR EUER LL 
的 坷 有 二 ， 或 是 用 于 地 址 计算 的 基 址 寄存 器 。 没 有 寄存 器 操作 数 的 指令 ， 例 如 分 支 指令 和 调用 指令 
器 没有 寄 仔 器 指示 符 字 上 节 。 那 些 只 策 晓 一 个 寄存 器 操作 数 的 指令 (irmovl. push 和 popp 将 另 一 个 
寄存 器 指示 符 设 为 8。 这 种 约定 在 我 们 的 处 理 器 实现 中 非常 有 用 。 

有 此 指令 第 要 个 附加 的 四 字 节 党 效 字 Ceonstant word)。 这 个 字 能 作为 irmovl 的 立即 数 数据 ， 
作为 rmmovi 和 mrmovl 的 地 址 指示 符 的 位 移 量 ， 以 及 分 支 指令 和 调用 指令 的 晶 的 地 址 。 注 意 ， 分 支 
指令 利 调用 指令 的 互 的 是 一 个 绝对 地 址 ， 而 不 像 IA32 中 那样 使 用 PC СБР 相关 的 二 址 方 
式 。 处 理 器 司 用 PC 相关 的 寻 址 方式 ， 分 支 指令 的 编 色 会 更 简洁 ， 同 时 这 样 也 能 允许 代 梧 从 存储 器 
的 “ 神 分 拷贝 到 史 一 部 分 而 不 需要 更 新 所 有 的 分 支 日 标 地 址 。 内 为 我 们 更 :关心 描述 的 简单 性 ， 所 以 
内 使 扩 了 绝对 嬉 引 方式。 回 IA32 -- 样 ， 所 有 整数 采用 小 端 法 {litde-endian) б. ЧЕ БГ 
网 格式 书写 时 ， 这 些 字 节 就 以 相反 的 顺序 出 现 。 

例如 ， 让 我 们 用 十 六 进 制 来 表示 指令 rrmovl $esp, 0x12345(%eñdx)B] Z Ti. MES 
4.2 我 们 可 以 看 到 ，rmmov] 的 第 - -个 字 节 为 40. БИЛЕ Фер MARIRE rA PEH, Maht 
п е ебх IN ARI UE TB 字段 中 。 根 据 图 4.4 中 的 寄存 器 编号 ， 我 们 得 到 寄存 器 指示 符 字 节 
42。 报 后 ， 位 移 鼠 编码 和 放 在 四 字 节 的 常数 字 中 。 首 先 在 0412345 前 前 面 填充 上 0 EIE A PCT 
变 成 学 节 应 列 00 01 23 45。 写 成 按 字 节 反 序 就 是 45 23 01 00。 将 它们 都 连接 起 来 就 得 到 指令 的 纺 
І8 404245230100. 

EIRE- TEREA ET Ан ТНЕУ А B. :个 惟 - 
iB. АЛЛ AAEE WE. ү86 就 具有 这 个 性 质 ， 羽 为 每 条 指令 的 第 
-个 字 节 有 惟 -的 代码 和 功能 组 台 ， 给 定 这 个 字 节 ， 我 们 就 可 以 决定 所 有 其 他 附加 字 此 的 长 度 和 
富 义 。 这 个 性 质保 证 了 处 埋 器 可 以 无 二 义 性 地 执行 日 标 代 伍 程 序 。 只 要 从 序列 的 第 一 个 字 节 开始 
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“确定 王 面 的 Y86 "Tv: ТТТГІЗ рту NW—31;4 i B H "TT 
X (100. 


pos 0x100 | 
ігтеуі 519, tebr 
rrmovl tebx,tecx 
loop: 
rmnovl &ecx,-3(*ebx) 
addl toby, tecr 
jmp loop 
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i — d G. ms 


练习 有 42 „ы iss pà АЁ. m. d m^ MEET Unc p+ % disp | 
"n TYEILUL T Y86 82 AF1). pE | dre, "Imm 


ИЕН АЫ Ж, AEREE TEELE, ЖЕЛЕ ЕҢ. 
А. ÜxlDD:i30]B3fcfffEFfFADA3000BODOD10 

B. Qx20D:al6B8008020000103DB30800000090 

с. Dx3DD:50540?00000000F0b018 

D. 0x400;6113730004000010 

E. üx50D:6362a080 
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Y86 Ti 4-808. CISC RARA. é h RISC R$ RH. e CISC и, ЕЕ. 
ЖЕЛ, NAAT HTAA, 和 RISC 一 样 的 是 ， 它 本 周 load/store КАН о 
( regular encoding ). Y86 di 4- So 004 &GE T CISC 4-4 11A32)， 但 又 根 据 业 些 RISC 的 原 
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$i. RISC5 CIBC x4 

T 9 464-20 4-8 80 ER. iE YK HG ADAE Ж T RISC 84 kde CISC P ELA p 
ЕТАЖА. RISC A £e BE ТИЯНЫҢ LT. dE RE А И ЫА, ДАЦ 
H Faik att S XO. edi EP PEE 2. 5 CISC EAR R SUL ET —4- 
HUE ES RE ЖИЕ УЕ CISC 42. m Bib eL BEA E DRE ЛЕН. 

大 名 数 公 司 都 推出 了 RISC EEAS, ВЕ Sun Microsystems (SPARC). IBM 和 Motorola 
| PowerPC ), ££. Digital Equipment Corporation ( Alpha ). 

EERDERE, Pati h. HAXXECLBRREOREHET. ясел eH RISCIEEA 
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技术 产生 出 与 最 好 的 RISC ЖЫЙ ЕҤ. ЕЕ Hi ABR E. 13 5 T Cp EE 
ii, 

RISC EER Ed Хк» ERO Y nh. GAKUEESTRMa ik. A £ hl 
LAARA ЕДЕ Ей. kika NP, EA Бен КЕЕ АЕН ETE, ibd ds 
BEA KG. EAEE ADARRE 1. 











ЇН 45 Н ТЕШ C ӨШ [A32 a YRA ГЕР, 
int Sun[int "Start, int Count] 
[ 
int sum = Dj 
while (Count) í 
Sum += "'5rartj 
Start-4«; 


COUunt--: 


return gum 
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1432 代码 
int Sum(int *Start, int Count) 

1 Sum: 
2 pushl Жегр 
3 movl %евр,%еһр 
4 movl 8Íí$ebpl,$ecx есу = Start 
5 movl l2(%ebp),tedx edt = Count 
2 xorl %еах,%еах ium = 0) 
f testli Җейх,Җейх 
d je .L34 
9 135: 
10 addl {%есх},%еах add *Start to sum 
11 addl 51, %ecx Start 

2 десі $edx Сошпі-- 
13 jn2 .L35 Stop when Ü 
14 .144; 


15 movl £&sbp,*esp 
16 popl $ebp 


17 ret 
Ү86 代码 

int Sum int *Start, int Count) 
1 Sum: 
2 pushl $ebp 
3 rrmovl %еѕр, %еБр 
4 mrmovl В (Фере), Фесх  ecx -Мап 
5 mrmovl l2í(€ebp),£&edx edx = Count 
ü xOrl Seax, seax sum = Ü 
7 andl £&edx,£&eocx 
8 іе End 
3 гоор; 
10 mrmovl {%есх),%ев1 get *Start 
1. addl $esi,€ezx add to sum 
12 irmovl 54. ерх 
11 addl %ерх.%еєесх Start + 
14 irmovl 5-1, %ерх 
15 addl *ebx,%edx Coaunt-- 
15 jne Loop Stop when Ü 
17 End: 
18 rrmovl Жерр,%евр 
19 popl %ерр 
20 ret 


图 4.5 Y86 汇编 程序 与 所 32 汇 编程 序 比 较 


Sum АҒЫН ККЕ. Y86 代码 与 TA32 fei SLE EERIL T, ERREUR JES Дт :条 ТАЗ2 指令 所 完成 
IARE. 
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XXE 1A32 AUR E C 编 详 器 GCC 产生 的 。Y86 代码 实质 上 是 一 样 的 , ЕТ Y86 有 有 时 需要 两 条 指 
令 来 完成 IA32 - -条 指令 就 能 完成 的 事情 。 如 果 我 们 用 数组 索引 来 写 这 个 程序 ， 要 转换 成 阅 86 代码 
MAE Г, КІЛ Ү86 188 (scaled) S hix. 

图 4.6 给 出 了 А уво 汇编 代 码 编 写 的 一 个 完整 的 程序 文件 的 例 了 。 这 个 程序 既 色 括 数据 ， 
也 包括 捐 令 ,命令 (directive) 指明 应 店 将 代码 或 数据 放 在 什么 位 置 ， 以 及 如 何 对 齐 aligh》。 这 个 
程序 详细 说 明了 楼 的 放置 、 数 据 梓 始 人 化、 程序 初 始 化 和 程序 结束 等 问题 ， 


— m — — ——— veode/arch/y66-code/asum. ys 
1 Jf Execution begins at address 0 
2 .pos 0 
3 init: irmov. Stack, %евр # Set up Stack pointer 
à irmovl Stack, $*ebp # Set up base pointer 
5 jmp Main 8 Execute main program 
6 
7 # Array of 4 elements 
H „align 4 
9 array; .long йха 
10 .long Охей 
11 .long Oxb00 
12 . long бӨхар 0 
13 
14 Main: lrmovl 54,%еах 
15 pushl $eax # Push 4 
16 lrmovl аттау, Фейх 
17 pushl %едх # Push array 
18 call Sum s Sumtarray, 4) 
13 halt 
20 
21 # int Sum(int *Start, іні Count) 
22 Sum: pushi $ebp 
23 rrmovl $€$esp,t*ebp 
24 mrmovl 8 (%ерр),%есх #есх= Start 
25 mrmovl 12 (%ерр),%едх #edx = Count 
26 irmovl 50, %еах # зит = 0 
Aj andl edx, Фейх 
28 іс ЕПС 
29 Тоор: mrmovl {%есх!,%е51 # gel *Start 
30 addl %esi,%eax # add to sum 
31 irmovl Sd,®ebx й 
32 addı Жерх,%есх ялан 
33 irmovl 5-1,%аБх # 
34 addl %еБх,%ейх Ж Count-- 
35 ine Loop # Stop when Ü 


36 | End: popl ebp 
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17 теі 
38 ‚ров Ох10й 
39 Stack: É The stack goes here 


—— — — —— coade/arch/y86-code/asum. ys 


图 4.6 用 站 86 汇编 代码 写 的 一 个 例子 程序 
НІНІ Sum rSf; 4 лж К, 


在 这 个 程序 中 ， 以 “. ”开头 的 订 是 汇编 器 古今 【〈asseimbler directives). НС A aa V ЕД 
址 ， 以 人 恒 在 滥 记 产生 代 名 战 插入 一 些 数 据 。 命令 .pos 0 (第 2 行 ) 告诉 访 购 器 应 该 从 地 址 0 处 开始 产 
全 代码 。 这 个 地址 是 所 有 Y86 程 译 的 起 点 。 接 下 来 的 网 条 指令 【第 3 行 和 第 4 行 ) ЖИЫНЕВАНТІЯ 
帧 措 峙 。 我 们 林 以 看 到 种 序 结尾 处 《第 39 行 ) 声明 了 标号 Stack， 并 且 用 一 个 ,pos 命令 来 指明 了 地 
At Ox100. ІІ TS АСТ АШ Жа» КК. 

程序 的 第 8 一 12 行 声明 了 一 个 由 个 字 的 数组 , 值 分 别 为 Oxd. 0xc0、 0хҺ00 和 0xa000. tr array 
表明 这 个 数组 的 起 始 , JF FLA TUE TERR SE Сарп 命令 指定 )。 第 14 一 19 行 给 出 了 “main” 
过程， 在 过 程 中 对 财 个 四 个 竺 的 数组 调用 了 Sum i2, ЖИН... 

run qe А ШІЛЕР, 用 Y86 Ferry тА СНА Д Е dr Pea, WEE d Bari] 
ЖЕ ЗЕРНЕ Э. ҒЫНАН Y86 o3 — Hep EE HR. АП ЕШ ЖИН АК |. 

E 45 是 一 个 我 们 称 为 YAS 的 汇编 器 对 图 4.6 ЧАМ ЫЫТ ASIE K. IUE T BERE. W. Was 
的 输出 结果 是 ASCII 而 格式 的 。 汇 编 交 件 中 ， 人 在 有 指令 或 数据 的 行 上 ， 和 日 标 代 码 包 含 一 个 地 址 ， 后 
型 跟着 15-6 个 字 节 的 值 。 

сойе/атсһ/у86-сойе/а5ит.уо 

# Execution begins at address 0 


DxÜOD: ‚ров Ü 

Охооо: 308600022000 init: irmovl Stack, S$esp # Set up Stack pointer 
üxD06: 208700010000 irmovl|l Stack, %ерр # Set up base pointer 
1х00с: 70624000600 jmp Mair # Елесше main program 


Ж Array of 4 elementis 


Пх0 14: .align 4 
0x014: Od000000 array: .lonq Dxd 
0Х918; с0902000 long QOxcü 
Піс: 00010006 . long ÜxbüD 


DxÜ2D: Ойа020009 .loóng üxaüJ0 


— — —— ..- 一  —  --- —IRININTA.-—FPV 


ПхОх4а: 308024300600 Man: irmovl 54, %еах 

0x02a: ай 28 vush} Феах Ж Push 4 
DxüÜ2c: 3085214000000 irmovl array,$edx 

0х032: a028 zushi Фейх # Push array 
ÜxQ034: 803а000000 call Sum 8 Sum(arras, 4) 
0x039: 10 halt 


# int Sum(:nt *5rart, int Count) 
Sum: pushl %ерр 
rrmovl €osp,t*ebp 


DxÜü3a: a058 
Üx03c: 2045 
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üx03e: 501508000000 | mrmovl 8{%ерр),%есх Ж ecx = Star 
0х044; 502506000000 | mrmovl 12 (%ерр),%едх Ж edx = Count 
ОхО4а: 308000000000 | irmovl 50, $eax # sum = 0 
{х050: 6222 | andl Ж*Жейх,Ж%едх 

0x052: 7374000000 | je End 

0x057: 506100000000 | Loop: mrmovl (S$ecx],*esi # get *3uar! 
üxübd: 6060 | addl ѕењі, ћеах # add to sum 
0х051: 308304000000 | irmovl $4,%ерх # 

Ox055: 5031 | addl зәрх,Фесх # Siart++ 
Ох057: 3O08S3ffIIEIIfÍ | irmovl $-1,%ebx # 

0х054: 6032 | addl ерх, едх # Count-- 
Ox05f; 7457000000 | jne Loop # Stop when Ü 
Oxü/4: b058 | End: popl €ebp 

ОхП?б; 90 | rer 

Ox120. | „роз 6x100 

0x120: | tacı:  # The stack goes here 


code/arch/y86-code/asum.yo 


647 YAS 汇 编 跨 的 输出 
每 一 行 包含 一 个 十 六 进 制 的 地 址 ， 以 及 字 节 数 在 1 一 6 之 间 的 日 标 代码 ， 


我 们 实现 了 一 个 指令 集 模拟 器 ， 称 为 YIS。 用 殿 拟 器 运行 我 们 的 例子 的 日 标 代 码 ， 产 生 下 和 面 这 
样 的 输出 : 


Stopped in 46 steps at PC = бх1а, Exception !НІТ”, CC 2-1 6-02 б=й 
Changes to registers: 


Феах: 0х00000000 Пх00Обарса 
%есх: 0х00000000 Ох00000024 
$ebx: 0х0о090000 Ох {ТҮҮ 
евр; Пх0000)0000 OxQg0000fB 
Ферр: 0х0900020000 0х02000100 
tegl: 0х00000000 0х0000а000 
Changes to memory: 

ӨхО0ІПй: 0х00000000 йх00000100 
0х0914; 0х00000000 9х002000039 
ÜxüUfB: Qx000000D00 Ox00000014 
OxDüEc: 0х00000000 Ox0D000004 


异 拟 器 只 打印 出 在 模拟 过 程 中 被 改变 的 寄存 器 或 存储 器 中 的 字 。 左 边 给 出 的 是 原始 值 《这 里 它 
们 都 十 03?， 石 边 的 是 最 后 汐 值 。 从 输出 中 我 们 可 以 看 到 ， 寄 存 器 Weax 的 值 为 бхаһса, HUE TIR 


数 Sum 的 四 元 素数 组 的 和 。 另 外 ， 我 们 还 能 看 到 栈 从 地 掉 0x100 开始 ， 向 下 增长 ， 栈 交合 用 导致 了 
存储 器 地 址 Oxfü-—Oxfc 都 发 生 了 变化 。 


练习 题 4.3 
ЖЕТЕ САЛ, Я Y86 代码 来 实现 一 个 递归 求 和 函数 rSum: 


int гӘшпііп- *Start, int Count! 
{ 
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ЪЁ [Count «s 01 
return 0; 
return *start > rSumi(Startesl, Count-1]; 
f 
k—& laan З. ЕЕ ЕЙ C PUR, AUS B je t Jü +i K. Y86 БН. ik ARARAT md 
有 帮助 . 


tk 2] 4.4 
push] Fit 4- ded Fatal, 4, Ж-ТАМА А АЕ Ф. 当 热 行 pushi Февр 指令 对， 北 
FEGA SETATA BARAHA R RA- AR EA. АЖАРЫ: DEA Фер 
ИЕ; ФЖАЖТ 4 besp Hi 
ib i1 X de A32 АЕА Н RAE GR ДЕ. AD EG iE Intel TEAS 
МЕНАТА ТНА, МЕНЖЕНЛЕАИЖННЫБЕ ТЕ. СЕЗРЕЛЯНАТЯХЖ 
фей фи нр, Вт АДЕ Ж А rk ЖБК Ж, ЖЫЗ 15. E 1,15 ТРЕТ, 
在 一 小 CORB b МАУ ЖГ АКДН k or ЖЩ. Ж {ЁН GCC 的 asm ӨНЕ, КЕ ЖЯ TS e TH 
UE. dX IE 5 ат ЖӨН, ёт W niti HCARD, IRE DER, 
Int pushtest || 
[ 
int гуа]; 
/* Insert the following assembly code: 
mov] &esp,«*eax | Save stack pointer 
pushi Wasp і Push stack pointer 
popl *edx k Pop it back 
&ubl *edx,WXeax Е 0 or 4 
movl *eax,rval E бәт as return value 


asn('movl **esp,*&osx:pushl &&espi;popl &*edx; 
БІРІ &*edx,**cax;nmovl *&WÀeax,*0* 
| черке (rwal) 
L /* Hë Input */ 
г "Aedx', "*eax"'!: 
return tval; 
| 


AAKER P., АЛАН ЖЕ ныне i& 145 4 0, 这 表示 在 1A32 中 pushl &esp 指 合 的 行为 
Ede 


ШІН 4.5 

t popl Tespa Еа ағы, Тыйтер X K MEE kanak, Ө“ТРЛІЛІеТ4 
gehe, MAJE daH, ЗТ А АЯ ТАЗ ВДЕ 2 ШИИТИ, B 
我 们 的 vae dca ЕН ЖІ. 

int poptestlint tval) 

| 
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int rval; 

/* Insert the following assembly code: 
pushl tval # Save tval on stack 
movi &esp,tedx Save stack pointer 


# 
popl Феяр # Pop to stack pointer. 
movl $esp,rval * Set popped value as return value 
movl *edx,tesp % Restore original stack pointer 
*/ 
asm("pushl %1; шоу! %%евр,%%ейх; popl %%евр; 
movl %*%esp,%0; movl #%ейх,%%ез5р'"” 


: "zr" [ryal) 
: 1 5-1 (Ема) 
: "Аейх”); 


return rval; 


) 


我 们 发 现 通 数 总 是 返回 tva, dust HEUTE RECS АЁ, ik RK ñ 1A32 中 pop] Феѕр 38 
令 的 行为 是 记 样 的 ?还 有 什么 其 他 Y86 指令 也 应 该 有 相同 的 行为 吗 ? 


42 ”志和 辑 充 计 和 硬件 控制 语言 HCL 


在 硬 忻 设计 中 ， 电 子 忆 路 被 用 来 计算 位 的 消 数 “人 nctions on bits)， 以 及 在 各 种 存储 器 元 素 中 存 
档 位 。 太 包 数 现代 电路 技术 部 是 几 信 号 线 上 的 高 电压 或 低 电压 来 表示 不 同 的 位 值 。 通 常 的 技术 中 ， 
逻辑 1 是 用 LO 优 特 左右 的 高 电压 表示 的 ， 而 逻辑 0 是 用 0.0 伏特 左右 的 低 电 里 表示 的 。 要 实现 一 
个 数字 系统 青 要 三 个 主要 的 组 成 部 分 ， 计算 位 的 函数 的 组 合 赣 辑 、 存 情 位 的 存储 器 元 素 ， 以 及 控制 
存 情 器 元 素 更 新 的 时 钟 信 号 。 

Aum, BATES BLZ Imm. S xS HCL (hardware control language, 
WERE RITARA E E KRAT BABERE КЕРН. EERIE NN Н 
НСІ. HCL 完整 的 参考 请 见 附录 А. 

旁 法 ， 现 代 逻 辑 设计 

硬件 设计 者 前 经 描绘 示意 性 的 还 辑 电 路 转 来 进行 电路 设计 【和 最 褚 是 用 纸 和 特 画 ， 后 来 是 用 计算 
机 图 形 终端 ) 现在， 大 多 救 设计 者 是 用 HDL 来 表达 的 ，HDL 是 一 种 文本 表示 ， 乔 上 去 和 编程 语言 
Хы, 但 是 它 是 用 来 柑 述 硬件 结构 而 不 是 程 库 行为 的 。 最 常用 的 语言 是 Verilog, Ер К+ С. 
男 一 种 是 VHDL， 它 的 语法 类 似 于 编程 语言 Ada， 达 些 语言 本 来 都 是 用 来 表示 救 字 电路 的 模 概 横 弄 
的 . 在 20 456 80 年代 中 期 ， 研 究 者 开发 出 了 还 辑 合成 ( logic synthesis) 程序 ， 它 可 以 根据 HDL 
的 拱 述 生成 有 效 的 电路 设计 。 现 在 出 现 了 许多 商用 的 合 点 程序 ， 它 们 已 经 成 为 产生 场 字 电路 的 主要 
技术 。 兴 手工 设计 电路 到 合 点 生 点 的 转 迹 就 好 剧 从 写 汇编 程序 到 家 高 级 语言 程序 ， 再 用 编译 器 来 产 
生机 器 代码 的 转变 一 样 。 


421 W] 
逻辑 门 是 数字 电路 的 基本 计算 元 素 。 它 们 产生 的 输出 ， 等 于 它们 输入 位 值 的 某 个 布尔 消 数 ， 图 
4.8 给 出 的 是 布尔 前 数 АМО, OR 和 NOT 的 标准 符号 ， 布 尔 操 作 的 逻辑 门下 面 是 对 应 的 HCL 表达 
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A. EWERAN. ЖІПЖЕНІ СФ ИНЕ Т НЕЕ (219 W). AND IB&&K s. OR 
НІНЕ», ІҢ MOT Hide. ЯН С hó Wira. CHEER AGB CIR p 4 dH ГЕНЕ. 
mid Е 


And Or Mot 
a - | a4 Е | 
е = “ем 
W= а s& b йн=а | b WiH= :а 


8485 ФАП 
WATER Ж ТЕШ Añ u TA ah. 


EAH LEETS (acuve), 一 旦 一 个 门 的 输入 变化 了 ,在 很 短 的 时 间 肉 , НЕНІ. 


42.2 组合 电路 和 HCL 布尔 表达 式 
村 税 事 的 巡 男 门户 会 成 一 个 网 ， 我 们 就 能 短 到 计算 块 (computational block), Mieta. Wi 
何 组 成 这 个 网 有 两 条 限定 : 
. 册 个 或 者 个 奸 界 门 的 输出 不 能 接 在 一 起 ， 理 则 它们 可 能 僚 使 线 上 的 信息 帮 盾 ， 导 臻 一 个 不 
cid tr np p cr ЯШ. 
f ЖМА. CREEA ДИНЕН И SSL EIB, ШІН 
[ЖЕНЕН TIE nes 
8 4.9 EARNER ESAME Cr BBM T. ЕНЕРИХайнь, EE odd Е 
ер “qa ЖЬ ЕЕ! (АРЕН АМО 门 可 以 看 出 } 或 都 是 在 【内 下 面 的 AND WGN H. d$ 
出 为 |。 用 HCL 来 写 这 个 网 的 函数 就 是 ; 


pool еда (а kk b | i| ( la ià ТЬ |: 





H4? 检测 位 相等 的 组 音 电 路 
24M ALBOS DEAE I IH. 1， 

ТАРЕ ШЕ VT fri (ЖЖ bool 表明 了 这 一 点 ) 信和 号 eq， 它 是 输入 a 和 AN. 
Aw PTM АТОН HCL ЙН T C Re НН. “=” 和 将 一 个 信号 名 与 二 个 表达 式 联系 由 来 ， 不 过 
lC 不 一 样 ， 我 们 不 把 它 看 咸 执行 了 一 次 计 算 并 将 结果 放 入 存 情 器 中 某 个 位 置 。 相 反 ， 它 只 是 用 一 
个 名 字 率 称谓 一 个 表达 式 ， 

538 4.6 


与 一 个 信号 xor 的 HCL AEA. xor Ж 4, ША ad b. (ES xorde Edit 3 M eq sr tf 
аж? 
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图 4.10 给 出 了 另 一 个 简单 但 很 有 用 的 组 合 电路 ， 称 为 多 路 复 用 器 (impulttiplexor)。 多 路 复 用 器 很 
АА EE SIE A -组 不 同 的 数据 入 号 中 选 出 -- 个 。 正 这 个 单个 位 的 名 路 复 用 嚣 中， 两 个 数 
据 信 号 是 输入 位 a 和 hb， 榨 制 信号 是 输入 位 s, 当 s 为 1 时 ， 输 出 等 于 a;， 而 当 & 为 0 时， 输出 等 于 
hb。 在 这 个 电路 中 ， 我 们 可 以 看 出 陶 个 AND ТТЕ РЕ ПАНТА О А НАЈ OR D]. 
当 s 为 0 时 ,上面 的 AND Ж FEW TES b《 因 为 这 个 门 的 另 一 个 输入 是 157， 而 当 5$ 为 1 时 ， 上 面 的 
AND HSS а. ЕР, ADDE Bf 9 ЕСІ АХ, МНО ЛЕ Gr Sp АА) 
БЕТЕ: 


bool out = із &k a ? || í !s &k b »; 





410 АТОН 
如 果 控 制 依 号 s 为 1, Reuse 5 а: ме 为 0 时， 输出 等 于 输入 b。 


我 们 的 НСТ. ЗА Е АЕА Т ARAARA C 中 逻辑 表达 式 的 相似 之 处 。 它 们 都 是 用 

布尔 换 作 来 对 输入 进行 计算 的 函数 。 值 得 注意 的 是 ， 这 两 种 表达 计算 的 卢 法 之 间 有 些 区 蓝 ， 

° 因为 组 合 电路 是 由 一 些 迁 辑 门 组 成 的 ， 它 有 个 属性 就 是 输出 会 持续 屿 网 应 输入 的 变化 。 如 
果 电 路 的 输入 变化 了 ， 在 一 定 的 延迟 之 后 ， 输 出 也 会 相应 地 变化 。 丰 比 之 下 ,，C ЖАЖА 
会 在 程序 执行 过 程 中 被 遇 到 时 汪 进行 求 值 。 

° СЇ ҢА, ЛҮ ЕЖЕ НЕШ. 0 表示 FALSE， 其 他 任何 值 部 表示 TRUE. 而 我 们 的 
i38] Hos rf 080 1 进行 操作 。 

ef 的 还 辑 表达 式 有 个 属性 就 是 它们 可 能 只 被 部 分 求 值 。 奶 果 一 个 AND 或 OR 操作 的 结果 只 用 
对 弟 一 个 参数 求 值 就 能 确定 ， 那 么 就 不 用 对 第 二 个 参数 求 值 了 。 例 如， 这 档 一 个 CC 表达 式 ， 
( à && la ) &k funci b, c ) 

XX E РА func ЖАКЕ ЖН. ВУ 1А 0 ate 1а REAO ПАЗЕНА 
AK E SAX], 3938] Н E R HO PES ELA RT AR 


42.3 字 级 的 组 合 电路 和 HCL 整数 表达 式 

通过 将 逻辑 门 组 成 一 个 更 大 的 网 ， 我 们 可 以 构造 出 能 计算 更 加 复杂 范 数 的 组 合 迁 辑 。 通 常 ， 我 
们 设计 了 能 对 数据 字 〈data words) 进行 操作 的 电路 , 它们 是 - 些 位 级 的 信号， 代表 一 个 整数 或 一 些 
榨 制 模式 。 例 如 ， 我 们 的 处 理 器 设计 将 包括 有 很 多 字 ， 字 的 太 小 为 432i, DURER. НЕ, iB 
令 忆 码 和 寄存 器 标识 符 。 

协 行 字 级 计算 的 组 合 电 路 是 根据 输入 字 的 各 个 位 ,用 逻辑 门 来 计算 输 员 字 的 各 个 位 ,例如 图 411 
中 的 一 个 组 合 电路 ， 它 测试 网 个 32 位 字 A 和 B 是 否 相 等 。 也 就 是 ， 当 且 仅 当 A 的 每 -位 都 和 B 的 
相应 位 相等 时 ， 输 出 才 为 1。 这 个 电路 是 用 32 个 图 4.9 中 所 示 的 那样 的 单个 位 相等 电路 实现 的 。 这 
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名 单个 位 电路 的 输出 用 一 个 АМО 门 连 起 来 ， 开 成 了 这 个 电路 的 输出 ， 


A) (Ж Ж ЫШ p 


= 





84)! —EGSHGSM ER 
"UE A FH ЕЕ В НЕР Е ЕТ, WIETT d. ВНА НСІ. РЗ TREE, 

A NE. 在 НСІ h, ЕТТЕ ЕАН m ОЛЧЕ ЧЕН XT. ӨНЕР 
ШЕП ЖИ AT, рТ И ор Г а А 8. HCL СРБЕ Y ЛЕ HW, ІНЕН 4 
Wr as Ep de e РРЛ wal Aa ЕТА ВЕ 

bool Eq = {А = = В]; 

DK BM Sa A ЮВ Ro im ІР). ЕАИС —И Н ЖЫ. “=” ko WU, Hü “= =" 
ЖЕ ИТТ. 

如 图 #4.11 ФАА ЕНІН. ЕПА НТИ Ж. ДИП Т ШЕ K or EE А 
roya. muli Е si ТА ТЕ А 


ЕЗІ 47 
H 5&1 8 46 aj E one Tq o dd eR Ар нон Ф 设计 一 个 了 2 性 
Fhaing 了 2 ТИ tA, ЖЖ ЕЛИП]. 


ІН 4.12 AETR АННЫ. 这 个 电路 根据 控制 输入 位 s 产生 一 个 32 位 的 学 Ot 
等 于 后 个 输入 宇 A gd B PELA T pul 32 Н-Т В 6, RET RC EAS ГІН 410 
{Үй ЖИН. TER FENER EARE 32 XH ЕНИН. НЕС 
Ou, ЖЕР Tur y aW ЕН] ҮЕ. Dah: B ABE SEEU] Cinverters) ЮЖ. 
ЕМІНЕН Чен НІН ЕНІН. CENNERE ЕЕ, LEER 
个 字 。 在 HCL D. ЖИНА КЕН А. (ease) kak k ҢЕР. ЕЕЕ fiet Е, 
| 
select, TE 
select г: ақы, 
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select; : Xr, 
] 
iX PRA XL НУН, 每 种 情况 ЖЕН ААКДА К select 和 一 个 整数 老 这 式 expri 
前 者 表 明和 什么 时 候 该 选 拌 这 种 情况 ， 后 者 指明 的 是 返回 值 。 
ін) C ЛА (switch) 语 名 不 同 ， 这 里 不 要 求 不 同 的 选择 表达 式 之 间 互 厅 。 从 还 煤 上 讲 ， 这 些 
选择 表达 式 是 顺序 求 值 的 ， 几 第 - :个 被 求 值 为 1 的 情况 会 被 选中 。 例如 ， 图 4.12 ESTER ФЕН! 
器 用 HCL 来 描述 就 是 : 


int ОЦЕ 


由 位 级 实现 B) Ti £ 


baa BE 
m DUfag B 
LOT wx pon 
амур" А 
int Qut = [ 
B: А: 
上 : B; 
|, 


ы] 


Bp 


图 4.12 字 级 多 路 复 用 器 电路 
当 控 制 信号 s 为 时 ， 输 出 会 等 于 输入 字 A BHS B, НСІ. 中 是 用 情况 (case) 表达 式 来 描述 多 路 复 几 器 的 ， 


在 这 段 代码 中 ， 第 二 个 选择 表达 式 就 是 1， 表 明 如 果 前 面 没 有 情况 被 选中 ， 那 就 选择 这 种 情况 。 
这 是 HCL 中 - -种 指定 默认 情况 的 方法 。 几 乎 所 有 的 情况 表达 式 都 是 以 此 结 昆 的 ， 

ЛЛА АА НСІ, 代码 的 可 读 性 更 好 。 实 际 的 硬件 多 路 复 用 器 的 信和 号 必须 于 
斤 ， 它 们 要 控制 哪个 输入 字 应 沪 被 传送 到 输出 ， 就 像 图 4.12 中 的 信号 s 和 4。 要 将 一 个 HCL RRE 
АТЫН, ZAAR (оріс synthesis). 程序 中 要 分 析 选 择 表达 式 集 人 台 ， 并 解决 任何 可 能 的 冲 
定 ， 桶 保 只 有 第 一 个 满足 的 情况 才 会 被 选中 ， 

选择 表达 式 林 以 是 任意 的 布尔 表达 式 ， 昌 有 任意 多 的 情况 (case)。 这 就 使 得 情况 表达 式 能 描述 
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ТЫНЫП. £u АД ЕЕ. Өш, Ж FR TER И НЙН: 





这 个 电器 根据 控 人 制 信号 а1 80 60, А-АА А. B.C D Hik, IRR CT TW) — 
进 制 数 必 为 控制 信号 。 我 们 可 以 用 НСІ. Ж Жа Fil. КРАН ЕМЕН W Ka ЧЫН. 


inr Out4 = | 


151 БЕ 150 А; # nb 
ІБ] : В; # 0i 
Же i C ғ 1 
ы : Di F IJ 


li 

HARER (TE ШЕ ЭТ RES RNEER ИНТ 利 О H 2 8 t ЕРЕ 
情况 会 被 选中 , TELE BEES EH ER Nau BARATA- FU ВОТ a АН. DNA, 
HO RERIK A ПАННЕН && 0, [395 ВРЕ s! %+ 0 ЕНЕ T 
ТАЯ Г. 

ШЕЕ А h T. Е Т Е ESU ЕЕ HUE A. B 和 万 中 的 最小 值 ， 
如 下 图 所 未 





用 HCL 来 表达 就 是 ， 

int Міпі = | 
А <= В БЕ ñ <= : Ài 
B <= А &k B <= С r В 
1 : É: 

| 


1& 51M 4.8 
可 这 样 一 个 电路 的 HCL ЖА. FAF A. BR C. БАФФИ, E393. WEST = 
лт AT AHEGRE X EA eve, 


ШЕЖЕ ШИЕ КАИ EATE ТАЈ ЕТЕ. Rim СЕНШ r RU 
diem mm. AETR (ALU) 是 一 种 银 重要 的 组 癌 电路 ， 图 413 是 它 的 一 个 摘 银 的 图 示 ， 
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这 个 电路 有 三 个 输入 两 个 标号 为 A 和 的 数据 输入， 以 及 一 个 控制 物 入 。 株 据 接 制 给 入 的 设置 ， 
电路 会 对 数据 输入 执行 不 同 的 算术 成 逻辑 操作 。 这 个 АШ 中 本 的 四 个 操作 对 应 于 уве hdi kas 
的 四 种 不 同 的 整数 拘 必 ， 而 神 制 值 和 这 些 析 作 的 功能 码 相对 点 {图 4.3)。 我 们 还 注意 到 减法 的 所 村 
ШЕК. EWA A BEEN 也， 之 所 以 这 样 做 ， 是 为 了 使 这 个 顺序 与 жыл S RORUF c 


1 - 
S Y. Y Ү- 
ШЫГ xv —X-Y “ХыҮ X = Y 
» x x X 


1113 ИЖ ЩАТ (АШ) 
ИЧСЕК А IML. АТРИ КАИ iH, 
424 集合 关系 ‘Set Membership) 
在 我 们 的 处 理 占 设计 中 ， 根 事 时 候 邦 需要 特 一 个 信号 与 许 雪 可 能 匹配 的 信和 导 健 比较 ， 以 此 来 检 
ВИТЕ ТЕАИ АТ И РЕ НА. РОТА Н Г. АНА 
йк ЖЕ ЖЗШ 4.12 РАНЕН Е sl 和 码 ， 如 下 图 所 未 ， 


оғы! 
| з ЕЕЕ ро бу Бу У 











D 
C 
B 
A 





негі, Bugs eT Н ЖЕ А ЕЕ Ж ЖА. B. CADER. WETE 
FIO. пн ЖН 941 RISO frt E: 

bool šl = code == 2 || rode == 3; 

bool ай = есейе == 1 || code == 

还 有 一 种 更 简洁 的 方式 来 表示 当 code 在 是 各 人 3] РІ code ZESE 2-01, ЭРЕН 80 Ж) 1: 

bool s] = code in [ 2, 3 |; 

bool вй = eode in [ l. 23]: 

ELE L KS HI VE; 

iexpr in | екрғі, expr, --. expr| 

RA expr ЖИЕН iexpr,7- iexpr, 帮 是 整数 表达 式 。 
425 存 情 器 和 时 钟 控制 

通车 电路 从 来 后 上 讲 ， 科 存 情 任何 信息 。 相 反 ， 它 们 只 是 简单 地 响应 输 六 信号 ， 产 生 等 于 输 六 
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的 某 个 函数 输出 。 为 了 产生 时 库 电 路 (sequential circuit ), lE dps t HERUM OS НИНЕ 
的 系 钳 ， 我 们 谷 须 引入 技 位 存 傅 信 息 的 设备 。 我 们 考虑 两 类 存 信 器 设备 ， 
* КЕЕ (ШИЖ АБ) TERIERY. НЕНЕН Л.Д. 
* ШЕЛ (ИКЕНЧЕ) FESI ШИШ ЕНЕНЕ ЖЕНЕ E. ШЫН 
ARATE.: КЫ н ҮТЕ АКТГ ҮҮЛҮКТҮ ТК о 
ЕТЕ ТУИ КЕН qA НЕЙ? WIB XD, Sik, ЖЕЙДЕ УНЫ. 
(Е 1A32 E Ya ЗР h, ТЕЗЕ УРЕН TPE E (We. “есі 9). 
мел а ЕН ЖНА. А Wie" dem а, ТЕШЕП. | 
ИҒЕНЕКЕЕНАНИННЕНН ИНК, ІНЕН, wina 的 是 CPU 中 | 
为 数 址 包 的 可 寻 址 的 字 ， 这 里 的 地 址 是 寄存 器 ID. ТАНИ ЧЕТЕ АТЕВ РЕР. КАТО 
ЕГО Е А — iii E ES, Hat ИЕ (1 8 Ur HH Ж 
Ха, ЖЕШЕНХН, Ж] WDR 1А Ww y “ЕНІН” H “FO EW ep", 
BI 4.14 ГА ЗВ, ШЕШ ТЕМ. КЕШЕ. ЖИНИНЕ ДӘ 
(H ух), ERRA STERSE. UI WI BIRI S ESL, 这 上 时， 产生 了 
ТИТЕ А. CH y Em. BR ЖЕН. КЕНЕН ЖЖ. ӘННЕН 
高 电位 的 时 候 ， 输 入 信号 就 加 载 到 害 存 器 ， 成 为 下 一 个 状态 y, 这 个 状态 就 成 为 寄存 器 的 新 输出 ， 
百 到 下 一 个 时 钟 上 升 沿 【rising clock edge) (МЕНЕ. 特别 指出 的 是 寄存 峰 被 作为 电 蹄 不 同 部 分 中 的 
ЧИ 2 [ЕЛЕ ВА. RAER A EGR., (DIEA WERBEN EXE n Н. 


КЖБ аз Tay 











Е 4.14 寄存 器 操作 
"йн P f EN НКЕ Т. ИНН ЕЛ. ЖН ЕК. ИИЙ. LAARA FARTEN. 


F 而 的 图 展示 了 一 个 奥 型 的 寄存 器 文件 ， 





ҮН ЕТТЕ (A Д В), Ef— PERS (W). iX FE—^- Ë ai vo ШП] FE 
TCVFFUM HEFT ET ERIS ВЕЕ. ЕШ ЕНЕЛЕР, ШИ ЕЕ FPE ERE AL |Ң 


КЕН 239 


HERA ТЕЛА. У О 8 — ARUBA. ЖДТ КЕШ А ВЕТ fra, УК 
— 3 H БЇ y PEP Sr Trash МАШ. ВАЕНИ 44 中 编码 表示 的 寄存 器 标识 和 罕 。 两 个 读 
ш CLE ИАА А. srcA 和 sreB (“source А” Ж “source B” 985) 和 数据 输出 vala 和 valB (“vale 
A" Ri "value BB” 的 编写 )。 写 端口 有 地 址 输入 dstW (destination W” misti 52, ШЕН А valW 
(“value W” HAB) 

虽然 寄存 器 文件 不 是 组 合 电路 (因为 它 有 内 部 的 存储 ), 但 是 从 中 访 取 字 的 操作 与 以 地 址 为 输入 、 
数据 为 输出 的 一 块 组 合 逐 辑 是 一 样 的 。 当 srcA 或 srcB RRRS AA ID, c&—B RIZ B, 
相应 程序 寄存 器 的 值 就 会 出 现存 ҰША 或 valB 上。 例如， 将 sra 设 为 3， 就 会 该 程序 寄存 路 物 ebx 
的 伍 ， 然 后 这 个 值 就 会 出 现在 输出 valA LE. 

时 钟 信号 按照 类 似 于 将 值 加 载 进 时 钟 寄存 器 一 样 的 方式 控制 向 寄存 器 文件 写 入 字 。 每 次 时 钟 上 
天 时 ， 输 入 valW 上 的 值 被 写 入 输入 ФУ 上 的 寄存 器 ID 指示 的 程序 寄存 器 。 当 dstW 设 为 特殊 的 
ID 值 8 时 ， 不 会 号 性 何 程 序 寄存 器 。 


43 Y86 的 顺序 (sequential) 实现 


现在 我 们 已 经 有 了 实现 Y86 处 理 器 所 需要 的 部 件 .首先 ,我 们 讲 - 个 称 为 SEQ( 取 的 是 "sequential” 
处 理 跨 的 意思 ) 的 处 理 器 : 每 个 时 钟 周期 上 上 ，SEQ 执行 用 来 处 理 一 条 完整 指令 所 需 的 所 有 步 又 。 不 过 
这 需要 一 个 很 长 的 时 钟 周期 时 间 , 因此 时 钟 周期 频率 会 低 到 不 可 接受 .我们 开发 SEQ 的 日 标 就 是 提供 
实现 我 们 最 终日 的 的 第 一 步 ， 我 们 的 最 终 目 的 是 实现 一 个 高 效 的 、 流 水 线 化 的 处 理 器 ， 


4.3.1 将 处 理 组 织 成 阶段 
通常 ， 相 旭 一 条 指令 包括 很 多 操作 。 我 们 将 它们 组 织 成 某 个 特 萄 的 阶段 序列 ， 使 得 即使 指令 的 
动作 差异 很 大 ， 但 所 有 的 指令 都 前 循 统 - -的 序列 。 每 一 步 的 具体 处 理 取 决 于 正在 执行 的 指令 。 创 建 
这 人 么 一 个 框 商 使 我 们 能 侣 设计 一 个 能 充分 利用 硬件 的 处 理 器 ， 下 面 是 关于 苦 个 阶段 以 及 各 阶段 肉 执 
行 操 作 的 简略 摘 述 ; 
ө HUB (fetch): ЖИНГЕ ДТ ИЕЫ МЕР, 地址 为 程序 计数 器 CPC) 的 值 。 从 指令 中 抽取 
出 指令 指示 符 字 节 的 两 个 四 位 部 分 ， 称 为 icode【 指 令 代 码 ) 和 ifun GESHE). СЕНГЕН 
出 一 个 寄存 器 指 东 符 字 节 ， 指 明 一 个 或 两 个 寄存 器 操作 数 指示 符 rA 和 rB, CET AER H 
一 个 四 字 节 常数 字 vatC。 它 按 顺 序 方式 计算 当前 指令 的 下 一 条 指令 的 地 址 valP。 也 就 是 说 ， 
vaP 等 于 PC 的 值 加 上 已 取出 指令 的 长 度 。 
е ЖШ (decode): 解码 阶段 从 寄存 器 文件 旋 人 最 客 两 个 操作 数 ， 得 到 值 vala 和 /成 valB. 1Ң 
To РАЗН rA ЯВ 字段 指明 的 寄存 器 ， 不 过 有 些 指 令 是 读 寄 存 器 %esp 的 。 
е 执行 Cexecute): ТИВ, Ж ҤЙ (ALU 要 么 执行 指令 指明 的 操作 (根据 ifun 
的 但 )， 计 算 存 储 器 引用 的 有 效 地 址 ， 要 么 增 妨 或 减少 栈 指针 。 我 们 称 得 到 的 值 为 vab, Е 
此 ， 也 可 能 设置 条 件 码 。 对 一 条 跳 转 指 令 来 说 ， 这 个 阶段 会 检验 条 件 码 和 《〈ifun 给 出 的 ) 
分 支 条 件 ， 看 是 不 是 应 该 选择 分 支 。 
° 访 存 (memory); 访 存 阶 段 可 以 将 数据 写 入 存 情 器 , 或 者 从 存储 器 读 出 数据 , 读 出 的 值 为 valM。 
* Hl (write Баск): 与 回 阶段 最 韦 可 以 写 两 个 结果 到 寄存 器 文件 。 
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* E Sr PC (PC update); Ж PC 设置 成 下 一 条 指令 的 地 址 。 

处 理 器 无 限制 地 循环 执行 这 些 阶 段 ， 只 有 在 过 到 halt 指令 或 一 些 错误 情况 时 ， 才 会 你 下 来 。 我 
们 处 理 的 错误 情况 包括 非法 存储 器 地 址 《程序 地 址 或 数据 地 址 7， 以 及 非法 指令 ， 

从 前 面 的 讲述 可 以 看 出 , 执行 -条 指令 是 需要 进行 很 多 处 理 的 。 不 仪 要 执行 指令 后 表明 的 霸 作 ， 
还 蓝 寸 算 地 址 、 更 新 栈 指针 ， 以 及 确定 下 -条 指令 的 地 址 。 幸 好 每 条 指令 的 整个 流程 部 比较 相似 。 
因为 我 们 想 全 硬件 数 基 尽 忆 能 的 少 ， 计 且 最 终 料 把 它 映 射 到 -个 二 维 的 集成 电路 总 片 的 表面 ，-- 个 
韭 常 简单 而 一 履 的 结构 是 非常 重要 的 。 降 低 复杂 上 度 的 一 种 方法 基 让 不 同 的 指令 共享 尽量 多 的 硬件 。 
例如 ， 我 们 的 每 个 处 理 吹 设计 痢 只 全 有 一 个 算术 / 远 辑 单元 ， 根 据 所 执行 的 指令 类 型 的 不 同 ， 它 的 使 
用 方式 也 不 同 。 在 肆 忻 上 复制 逻辑 块 的 成 本 比 软件 中 有 重复 民 公 的 成 本 大 得 和 多， 而 忆 在 婕 件 系 统 中 
处 理 许多 特殊 情况 和 和 特性 旨 比 用 软件 来 处 理 几 难得 多 ， 

我 们 面临 的 一 个 挑战 是 将 每 条 不 同 指令 所 舌 要 的 计算 放 入 到 上 述 半 个 通用 框架 中 。 我 们 会 使 用 钨 
4.15 中 所 水 的 代码 来 描述 不 同 Y86 指令 的 处 理 ， 图 4.16 一 图 4.19 中 的 表 描 述 了 不 同 Y86 指令 在 各 个 
阶段 是 怎 伴 处 理 的 。 要 好 好 研究 一 下 这 些 才 ， 表 中 的 这 种 格式 很 容易 映射 到 硬件 ， 这 些 表 中 的 每 -- 行 
都 描述 了 -个 信号 或 存 嵌 状态 的 分 配 《 用 分 配 失 和 攻 志 来 表示 )。 阅 读 时 可 以 把 它 看 成 是 从 上 至 下 的 需 
序 求 性 。 后 面 我 们 将 这 些 计 算 映 射 到 硬件 下， 会 发 现 其 实 并 不 需要 严格 按照 顺序 来 执行 这 些 求 值 。 
Ох000: 3082050000650 


| 


irmovl 53, %wedx 


2 üxD0b5: 305315000000 1 irmov] $21, &ebx 

3 Ох00с: 6123 | subl edx, Ферх # subtract 

4 ОхОбе: 506480000000 | irmovl 5128, #езр Ж Practice Prob. 4.9 
5 Пх014: 304364000000 | rmmovl %esp, 100{%еБх) # store 

Б Üx0la: a028 | push. Фейх # push 

7 0x01c: Ь0С8 | popl *eax s Practice Prob. 4.10 
8 DHRUle: 7328000000 | je done * Not taken 

9 0x023: 8029000000 | cali proc Ж Practice Prob. 4.13 
10 0х028: | done: 

11  Oxü28: 19 | hait 

“2 9ж029: | proc: 

3 8х029. SQ | ret # Return 


4 415 Y86 指令 序列 示例 
我 们 会 通过 各 个 阶段 来 惧 踪 这 些 指令 的 处 理 ， 


图 4.16 给 出 了 ОРІ (整数 和 逻辑 运算 }、qmmovl (寄存 器 -寄存 器 传送 ) 和 irmovl (ХОН Sy r 
器 传送 类 型 的 指令 所 需 的 处 理 。 让 我 们 先 来 考 虚 一 下 蒜 数 操作 。 回 夺 图 4.2， 可 以 看 到 我 们 小 心 
地 选择 了 指令 纺 码 ， 这 样 区 个 整数 操作 Садат. subl, andl 和 хог) 有 着 相同 的 icode (8. ЖЕЛІНІ) 
以 相间 的 步骤 顺序 及 处 理 它 们 ， 除 了 ALU 计算 必须 根据 ип 中 编码 的 具体 的 指令 操作 来 小 十 。 

整数 控 枯 指令 的 处 理 遵 循 上 面 列 出 的 通用 模式 。 芷 到 指 阶段 ， 我 们 小 南昌 常数 字 ， 所 以 valP 的 
ИЯ РС + 2。 在 解码 阶段 ， 我 们 要 读 两 个 操作 数 ， 在 块 行 阶段 ， 它 们 和 切 能 指示 符 ifun - -起 后 
提供 给 ALU， 然 后 valE 内 放 入 指令 结果 。 这 个 计算 是 用 表达 式 valB OP valA 来 表达 的 ， 这 申 ОР 
代表 ifun 指定 的 如 作 。 蓝 注意 两 个 参数 的 顺序 一 一 这 个 顺序 与 Y86 (和 IA32) 的 习惯 是 一 笃 的 。 册 
ШІ, 指令 subl Феах, %edx， 计 算 的 是 А[%ейх] - М Фе ИЯ. 这些 指令 在 访 存 阶 狼 什么 也 不 做 ， 而 
在 写 回 阶段 ，valE 被 写 入 省 存 器 虽 ， 然 后 PC 设 为 valP， 束 个 指令 的 执行 就 结束 了 。 


ккан 





Erxov] rA, FË 









кииб = МРС] 





icodeilun = MPE] 
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ігенуе1 М, Е 
eodein — МЫРС) 


ГАН = M.[PCG21] rkrB — МЇРС+1| гай — MW.|PG+1] 
ий — М/РГ+2| 


МР — РСэй 















vnl? — POH 
väl 一 НА) 
vali -- А] 


vaP - Pei 





vaih — RirA] 








и! valE = walB ОР vali | 
каа ШЕ - О+уВіА walE - (derail 
LL 
— | | = 
F | НВ] = valE | В] = val E гё] ~ 
| 更 新 PC Г РС = мајр PG = мар | PC = valP 


Е 416 УВЕ ЖФ ОР. mov 和 inmowl 在 三 序 实现 中 的 计划 
A5 NT Tü. AARRE RTP. ЕҢ кесене ЖЕ ny ҮТЕН ЕН. (H тАлВ ЛЕС 
ТЕЛНЕ HRS. fy Mira (ШЕН) ЕЕН а — t3. T Mx UE ЫЕ. 

必 为 一 沾 仙 于 ,让 我 们 来 看 看 一 条 шы HB4 HI k pita, HERR RB AGE 4.15 了 所 示 目 标 代 玛 的 第 
3 行 中 的 жы, АТАЯН IRE e HER AAA іх Бесік зон (Cl, 94e 21, 还 能 
ЖФА Th охе, FAAET, J 9 P| ЫЫ de 0x23. AAA HETEN, £ 
isis Т ЭБЗЕ ОРІ 840538 LEAL (HD 416) dtd МАНАҒЫ ЫЫ. 





сй AMA AA uU, бп Тиен Ж. "een 设 成 了 12. = 
m. T Ü, m PC deT 2, 


LIT movl f ARIETE is Жы. ЖЩ. ЖЖ ШШЕ Ен. ПІ ALU 的 


442 каз 

i 
S TAKES 0, ЖЕЕНЕ- A IEEE. AA] valE = ҰША, ЖПЕНҒЕ ННІ ы 
fF. Қ irmovl ЙН ЕБ ЁШ, EET ALU АЖ - АЛЕ ЕН уак. 52. BLS R KR . 
ЦГіппоуі, ВЕЗИ ИЛИ) 6. НАН e К РЕВ. 

ЖШ 43 

ШК Ki А 4, &5 ЖИЕН š Ë 4.15 ФЕ kan 4 FE 65 тюм] HERAA: 














тн ШЕ ЕТ” | 
irmo] W,mB | irmovl $128, Февр 
к сокит 一 МРС i 
rE — MIPE) 

| та — МРС» 2) 
== mP 一 PC+6 

"n 

ке Ки 
b ge Shane ug 


ik dedii 09 Je k ALA ed Eo PC? 


图 4.17 给 出 了 存 能 器 谍 写 指 寺 rmmovl 和 mmol ЖШ. 基本 请 程 也 和 前 面 一 样 ， 不 
过 是 用 ALU 来 加 valC 和 valB. BERI Zr GE ЕНГЕН ЦЕ (rab M Б ЖЕЕ ЛЕ TH), WU 
FEEL GR AAAI vala ІЗІН, ЖЖ АТТИШ ФЕН valM. 


т I грот] ҒА Dr) 

Т | кебейш = МІРСІ 
ТАВ — МуРС+1| 
wal 一 МАРС а] 


кобейип = MPE] - 


АВ =- М[РС+1| 


vac — МРС+2]| 






ЖЕР | PC = мар РС = wif 


图 41 YOS 指 守 rmmovi ЖІ mmo Ж РЕЖ БИ 
I eem TUE УЛЕШ, 
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让 我 们 来 看 看 图 二 15 中 目标 总 码 的 第 3 HE Hetaa. тыйнң, меніне 
LAFA зер HERAT 128. сік MRA nubiy CREE Жайын D. Айтты 
Жы, Mpp Ы Ок, EE, WA ALA 0440 быз, E 43 E mioa М 
СТАНЕ 100) AT SERIAHSAEN, ЕНИН Т. 


E; | 












ILE С ВИНЕН, i def Ip EAUX [29 ЕЛИ Ен 112, ЖИРСЫС. 

HI 4.18 ТІН ГА push] 和 pop 指 他 所 需 的 步 村。 它们 可 以 算是 最 难 实现 的 YB6 hy T, 因为 
ENS R MUI. XENIEMONIE. RRRA ARER, BET 
是 有 很 重要 的 区 别 的 。 


pushl rÅ 





| кобейип = M.[PC] 


| ісіні = MPC] 
AB = MjPC1] 


AB — MPi] 


valG = РС+2 
valA = R[rÁ] 
| _ |хай = ісері 
Ыш | walE — уш) 









МИР = Рза 2 
ҰША 一 R[kesp|] 
ҰН" a LETTE 
WWE — vali 
Нізене| = valE 

















М.а Е) — v#A 
-— € 


| R[&esp| = walE 
АГА] = чм 


чы 
ua m PC — valf 


图 4.18 YES ЖФ pushi 和 pop 在 顺序 实现 中 的 计算 
ТТА 
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pushi f ЖЕП R ABRE TT TRI Wd, НЕНІҢ, ЕНЯеріЕІЯ КЕГЕН 
全 数 的 标识 符 , ЖШН valB. (ІТ, HJ АЛЫШ. MUS 4 的 值 就 是 存储 器 
写 的 地 址 ， 在 写 回 阶段 还 会 存 回 利 %esp ір. H valE 作为 写 操作 的 地 址 ， 是 遵循 了 YR (ТАЗ?) 
的 卉 例 ， 也 就 是 在 写 之 前 ，pushl 应 该 先 将 找 指针 碱 去 4， 即使 栈 指 计 的 更 新 实际 上 是 在 存储 器 狠 作 
sth s nod tT I. 


Sif: HUE push f drift 3 
ШАТТА ЖЯ 4.15 F Н ЖАА Ё 6I E rmmovl ИИН. JS. 35 BWedr thi 


A 9, Бер Мж 128, ANETAR тын байа. ЖЕЛЕ. p| 
(тай 和 x28, ЗАК ЪТ: | 


Гисс 
ks ' | 
ы 
x 





кәйеішп — М[Охйдг]}ша: д 
MaB — Мохб14р2:8 


ҮӨР = üxüla«ZzOxolc 


ҰЙЫ 1-32 Kalai, ERE AH ЖЖ ЫЛ tepika 124, W 9 H Aik М, Ж PC 
№ 2, 


рор! TH kr s pushl Bof ETE EL, 4 ІГЕНЕШРЕШШІЕНДН H5. ЗЕЕ ЕА 
ІНЕ, 但 是 我 们 会 看 到 让 WA 和 valB 都 存 m HEB. КЕКШЕЛЕН ҢІН wr НІН, 
FR T Buri k SEHE. АТЕВ. ШЇ ALU 给 栈 指针 加 4， 但 是 用 没 加 过 和 的 原始 值 作为 存 情 
БЕРІНДЕ. ESERE ЖЕҢІП 4 的 覃 指针 更 新 乒 指 针 寄存 器 ， 还 葛 将 寄存 器 ТА 更 新 为 从 
仓储 器 中 请 出 的 值 。 用 设 加 过 4 EHE UEBER AE, БТ Үй CH [A32) BER, pop 应 该 
НІМ, ВЕНЕ. 


ЈЕ 4.10 
WETAH EH, ka kaa 3 B| 4.15 Ф ИЗЕЛ ТЕРЬ popl НАЛЫ; 
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Yu a | да | | 
| popl iA _| Ponl Yoax | 


iodeilun — МІРСІ 
ПАВ: = MPO] 











valP — PC+2 
wÀ — Н|%еср] 










EF PC CETT <. С 
ИРНЕ НЯ T £ ЕЕ + PC Ж? 
еге т к SENSO H: 
根据 图 4.18 p FUE aR, Te pushl esp ACIE АЖЫКЕ? каа 44 A ҮЗЕ 
Bst SH — uy 
ЕЗІН 4.12 xi 


Ж рор! &® o Fr RE i68 КА UE 416 FI d ABA HER, popl wesp алын 
ERATAN! 2538338345 ARH YES PAS st 4) 


图 4.19 Ж í ЖП — SH E SERE h AREE. НЫН. call 和 ret. 可 以 看 和 到， 我 们 能 用 同 
a du 18-9 — FERE pc PE ec Id, 










E419 YB& 指令 xx. cal ret 在 期 序 实现 中 的 计算 
icf SEEMS. 


246 Е. 

ПЕСНЕ РЕ Е. RERU- RESET ВГ АЕ РЕТ Г КЕНІН. [I AETIN A BL Е Р 
s LS ЕСЕНЕН, ВЕ НАЕ НМЕ ЕАН ВОТ ОЕ АНЫН З, БЕГЕЙ 
ua fmi. ІН. Т Ede РЕНЕ KP KIPA Г НОГ С. 产生 
出 一 个 一 性 信号 Beh EER PERE З ХЕ, RE e Eg D. WH PERA valC 
(ЖЕН. Ш O, 0 vaP 《下 一 条 指 专 的 地 址 》。 我 们 的 表示 хась SAF СӨЗІНЕН 
表达 式 一 一 当 工 非 零 时 ， 它 苦于 g， 当 为 雪上 时， 等 于 汪 。 


Wit. НЕ je 指令 的 镇 行 

т ЕЮ 415 t E dE Ж RITE je НЕН. вы ЕЖЕЛ 122) 
ЕЕ aT 0. Wu ФАКЕЛ К. іі Тин Ое, 4 5 PPY. $— TIE 
3 0x73. Q M T poop £ Ж + охооо? O TW R q ЖЇН. b3K3S AYO Е, T 
БЕИТ: 


И а 
















valC = М42х01ҒБ0ч028 
МИР = üxüled5-Uxüi)! 


кыа pod Жай. ФА ДЕН PC de 5. 


Ii сай 和 ret. СІН? pushl 和 pop ЖШ. Bp ГЕРЕ ЕТЕ ВЕНИ А ЕЕ ЯР. pg 
call, ПЕ vaP. Е call f ERAT RETE P In. ҚАҢ. ТЕТ PC ИЕ, Ж 
PC жас. dk HE НОТ. ie ret， 在 更 新 PC EP, ЖҮЛ чам, MAR НЛ. 
МЧ PC. 


8:278 4.13 
ШЕТА а —Н. ü kikiki 415 ФЕ ЕЛЖ 9 FT ER call 82445 НЯ: 
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call Пяй?Ч 








кш ісоба:Нуп == МЫРС) 


val = МЫРС] 
valP 一 PC+5 











valli — [еер] 








| valë = ValBs-4] — Ç = WalBai 
a | MlvalE] — ушр | 
Н[%®п=р] 一 -WE 








Шы — увс _ г 


ЖЕНРНІМТЕАЕНАТАЯЛЕ. рд E ©? 





38,05 464608 4.15 中 目标 代码 的 第 13 HR mt MAREEA. яни Е 05009, АЖ 


Е А д8, (x9). ча а Катын ы ASAS A 
地 是 үм, РИНКИ: 地 址 Dm028 FRETA 





| = Üx0JH ` 
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ib HR АА, den EHE 44 РС Ж 008 пан ен. ШӘ. 
Зер ЕЖТ 128. 


RHET- TRAER КЕШЕА ЖЕНЕ Y86 de. BUB ИТ ЭЕ d ila, dH 
та АВ ШЕННЕ УВА В, BOE ELT CERE HE ОАЕ Р Е С В Ер ВЕ, GEHE 
ҮЛПЕТЕШЕ. 


432 SEQ 硬件 结构 

变现 所 有 ҮЕФТЕЕНІЕНШИ НЫЛ ЕЖ ШІН. MEL. 执行 ， 访 存 ， 写 固 
和 更 新 рс, Ва оН T — ri is ei wer Hume dern. РОВЕР ОЕ EBD, 
AAPEA ORT "PC. MAERAH (CEST WH W GAREN. ЖГ. 
Sip. ИТЕН X: lah Ж A. (һапймаге units) ЖАНА, КШН Б ЕЛ in, 
ues. ШАШ ИЕНЕН. КЕНЕ T ЕЧ ТИЙИ. 
ЖЕТ ЕКЕН ЖИЕ ТЕН ЛА AS Е IH B|; b о е BW O u Rq nie 
ИЕ НЕ, AILA Fit E SERE MO i EA Si. ТЕТІН ИИИ KER IE I 
цияны, ГУИ ЕА 2 miku Ч. 

V PE RC ТЕЕ НЕН ЖШ: 

ЕН ЖЕТИЯВЯН ЕЕ АҢ, ЗВЕНЕ ТУН ЕСЕ П, РС Wins (РС 
incrementer) 计算 valP. DAMT HEFINA. 

解码 ;寄存 器 文件 有 两 个 读 病 口 点 和 一 ， МИП НЕТИ val 和 valB. 

执行 :执行 界 段 会 根据 指 他 的 类 型 ， 间 算术 / 坚 冰 单元 【ALU HT ++ ЕЕ НЇП. УЕП. 
它 于 执行 指 对 所 指定 的 运算 ， 对 其 他 指 地 ， 它 会 作为 一 个 加 法 点 来 计算 增加 或 碱 省 相 指 针 ， 或 者 计 
ИТН, АРАМАН О. 特 一 个 输入 传递 到 输出 ， 

XT WES (CC) AETR ALU А НИИ ЯЕ ЗИ АИ. ЧАТ ВЕНЕ, 
ЕН РЕОН ЕТ ИС KTN S Beh. 

uin ЕЗТНЕ АТ, ЕЖІТМЕ (datamcmory) i£ ^— Tr fri mer. Hoy 
{ГА us er dH SS ЕА Е, HERI T PII H. 

Eg. ЖЕРИМ НП. ИПЕЛЖНАЛУИЯНН ЖЕНД. fud c M HESS Sn 
ЕНЕ ЕНЕ. 

图 4.21 таны ТЕҢ SEQ ЖЕНБІЗЕІР(НКНОНЕТҒРЫН, ЕЛЕНЕ 
mero. 我 们 看 到 一 诅 和 前 面 一 样 的 硬性 单元 , {Н ЖИ ЕШ ИЖА ЕИ ЕТ. 在 这 幅 图 以 及 我 们 其 
ӘНЕ, ЖЕНЕ МЕНТІ. 

а ДЕЖАВУ & т +} Ж, xti. АШ ҰЗ, EZ fist SE 
Жз, Mtt- Akr. ПЕН t НЕ “ЖТ”, ЛЕП 
nm. 

. Rep tH E ЖЕШ АЕ Жи. x AX HUE AERP IUE. AERE 
W—Hdp qmm. RSRS, ЖИПТЕ НСІ. 描述 ， 

. HELLTESOBEBRBAXIGSvISU. ER ЁН. ПЖ АНН ЛЖ. 

s. Жїн ИА Ет. АРЕНУ КИН Ж—ШЖ 32 ЫҢ, 
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ЖЖЖ Е—&, ЖҮЛ — АЕ НЕ Е Wo. 








| i PC 
ники — 
(PCI | 
кыы “ШЕ, vafe 
tale] 
p valki 
- к 
ні. EN 
valz 
ГТ! ma | ШТ 
| аша аше 
Wi 
ізін, ur, 
rA, rÜ IR 
val 
i Sd PC 
AME ab 


542) ЗСИНЕНЕ, -HEEL 
көнген Watay ШЕШКЕН НЕН. АШ КЕНЕШ (РС› ПЕН, ШЕФ ТАЯ. 


. ЖАЗАР НЫНЫН ЕН Л kART: НННРЕНІНІЕЕН, ШЖ 
REMER- E adig i. 
. ЖЕНЕН Ф А. LARTA йл Б? AAA ЫЙ. 
| 416—419 ETERNI RR FE SERRE. ITE ECTHBE m кабр, ШЕК 
ИЛИ лс, ШИН. 22 AEN T ikisi ИЕ ФЕ. B T ПЕН АНЕ ЯЗЫ 


号 以 四， 还 列 出 了 四 对 寄存 器 ID FE eå, valA ІН) sB. valB НІН; dE. 5^ valE HJ W 
08, DUH dsiM, BA valM ЧЕ. 


ит КЁ 
РС) 










(ам) 
“Так ІЛЕ 






us 
АП | 
Wn A B 1 
өн 
- i 
Ea Хе Y) G) 
FTT T T I 
E gir I MB eL 


图 4.21 SEQ MENES, -тЕЛЕІШ 
Н РЗД ҮШ ЖИН M Tik. ШИГЕ Ж. 
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ЕСІЛ 


icoda:ilun — МРС) icode:ifun. = МАРС) 
гА:гВ — M.[PC+1] гАВ ~ M. [PCG421] 
чаі -— W.[PC221 
valP — РС+2 valP — PG+6 


"5-22-24 - 
valB, srcB valB = R[rB] valB = R[rB] 
PEE Codes w CC 


PNE БЕС — vaM = MbaE] | 


E port, dstE R[rB] 一 valE 
M port. даз АТА] — valli 
а 8 а |н 


图 4.22 ЖАНР АН ПУЛ АЖ 
第 一 栏 标识 出 SEQ 的 阶段 中 正在 被 计算 的 值 ， 或 正在 被 执行 的 操作 。 作 为 示例 给 出 的 是 指令 DPI 和 mmol 的 计算 。 


ЖІ, ЖА Н МЕЗ > ОРІ 和 mrmovl 的 计算 ， 来 说 明 要 计算 的 值 ， 归 将 这 些 计 算 驳 射 
到 碳 件 上 ， 我 们 要 实现 控制 逻辑 ， 它 能 在 不 同 重 件 单元 之 间 传 送 数 据 ， 以 及 操作 这 些 单元 即 对 每 
个 不 同 的 措 令 执行 指定 的 运 握 }。 这 可 是 控制 逻辑 块 的 日 标 ， 控 币 逻辑 块 在 图 421 ЧИКЕ ЯУ 
框 表 水。 我们 的 性 务 三 是 着 手 每 个 阶段 ， 创 建 出 这 些 块 的 详细 设计 。 


4.33 SEQ 的 时 序 (timing) 

在 介绍 图 4.16 一 图 4191, 我们 说 过 阅读 的 时 候 要 把 它们 看 成 是 用 程序 符号 写 的 ， 那些 赋值 是 
从 上 到 下 顺序 执行 的 。 然 而 ， 图 4.21 中 硬性 结构 的 操作 运行 祖 本 完全 不 同 。 让 我 们 来 看 看 这 些 磺 件 
是 怎样 实现 表 中 列 出 的 那些 行为 的 。 

我 们 的 SEQ 的 实现 包括 组合 逻 辑 和 两 种 存储 器 设备 : 时 钟 控制 的 寄存器 《程序 计数 器 和 条 件 码 
寄存 器 ) 和 随机 访问 存 情 器 〈 寄 存 器 文件 、 指 令 存 情 器 和 数据 存储 器 }。 组 合 逻 辑 不 需 昌 任何 定 序 
(sequencing? 或 控制 一 一 只 要 输入 变化 了 ， 值 台 通 过 次 辑 门 网 络 传 播 。 正如 我 们 提 到 过 的 那样 ， 我 
们 将 恋 随 机 访问 仓储 器 看 成 和 组 合 逻 辑 一 样 的 操作 ， 根 据 地 址 输入 产生 输 剖 字 。 因 为 我 们 的 指令 存 
情 器 只 用 来 读 指 令 ， 因 此 我 们 可 以 将 这 个 单元 看 成 组 合 远 辑 。 

现在 还 剩 四 个 硬件 单元 需要 对 它们 的 定 序 【sequencing ) 进行 出 确 的 控制 一 一 程序 计数 器 、 条 人 忻 
码 寄 他 器 、 煞 据 存 依 器 和 客人 存 器 文件 。 这 些 单元 是 通过 一 个 时 钟 信号 来 控制 的 ， 它 触发 将 新 值 装载 
刘 寄 存 器 以 及 将 值 写 到 区 机 访问 存储 器 。 每 个 时 钟 周期 ， 程 序 计 数 器 都 会 装载 新 的 指令 地 址 。 只 有 
在 执行 整数 运算 指令 时 ， 才 会 装载 条 件 码 寄存 器 。 只 有 在 执行 rmmovl. pushi 或 call 指令 时 ， 才 会 
马 数据 人 存储器。 寄存 器 文 侍 的 两 个 写 端 只 允许 每 个 时 钟 周 期 更 新 两 个 程序 寄存 器 ， 不 过 我 们 可 以 用 
特殊 的 寄存 器 ID 8 作为 端口 地 址 ， 来 表明 在 此 端口 不 应 该 执行 写 操作 。 

控制 我 们 处 理 器 中 活动 的 定 序 sequencing)， 只 需要 寄存 器 和 存储 器 的 时 钟 控制 。 我 们 的 硬件 
298 ЖЕРЕ 416-6419 中 那些 赋值 顺序 执行 一 样 的 效果 , 即使 所 有 的 状态 更 新 实 蒜 上 同时 发 
生 ， 提 只 在 时 钟 上 升 开 始 下 一 个 周期 时 。 之 所 以 能 保持 这 样 的 等 价 性 ， 是 由 于 Y86 指令 集 的 本 质 ， 
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也 是 由 于 我 们 按照 遵循 以 上 原则 的 方式 来 组 织 计 算 的 ;: 

“处 理 器 从 来 不 需 时 为 了 完成 一 条 指令 的 执行 而 去 读 由 访 指 令 更 新 的 状态 。” 
这 条 原则 对 我 们 实现 的 成 功 来 说 至 关 童 要 ， 

为 了 说 明 河 题 ， 和 假设 我 们 实现 pushl 指令 是 先 将 名 esp 减 4， 和 再 将 更 新 后 的 和 esp ШЕЛ HET 
НЕ. 这 种 方法 就 间 前 面 所 说 的 那个 原则 相 违 背 . 为 了 执行 存储 器 操作 ， 它 需要 先 从 寄存 器 交 件 中 
读 更 新 过 的 栈 指针 。 而 我 们 的 实现 【图 4.18) 产生 出 减 过 了 的 栈 指 针 值 ， 作 为 信号 yalE， 然 后 再 用 
这 个 信号 既 作 为 寄存 器 写 的 数据 ， 也 作为 存储 器 号 的 地 址 。 困 此 ， 在 时 刍 上 升 开 始 下 一 个 周期 时 ， 
处 理 器 号 可 以 站 时 执行 寄存 器 号 和 存储器 写 了. 

再 举 个 例子 来 说 明 一 下 这 条 原则 ， 我 们 可 以 看 到 有 些 指令 《整数 运算 ) 会 设置 条 件 码 ， 有 些 指 
令 【 跳 转 指 令 ) 会 读 取 条 件 码 ， 但 没有 模仿 必须 既 设 置 又 读 取 条 件 码 ， 昌 然 要 到 有 时钟 上 升 开始 上 一 
个 周期 时 ， 才 会 设置 条 件 到 ， 但 荐 在 任何 指令 试图 读 之 前 ， 它 们 都 会 更 新 好 的 。 

让 面 这 段 牧 码 是 汇编 代码 ， 堪 边 列 出 的 是 指令 邮 址 ， 图 423 给 出 了 SEQ Ш ЕА] АРЕ Нз 
第 3 和 第 4 行 指令 的 : 


1 Dx0D0: irmovl $0xiD00,€*ehbx 9 ebx «-- DxI00 

2 0х006: irmovl $0x200,edx # wedr <-- 0x200 

3 Оҳода: addl %wedx,%ebx # ерх <-- 0300 CC <-- 000 
4 Охо0е: Je dest # Not taken 

5 OxÜüli: rmmovi $ebx,0ií*&edx) # MIOS200] «-- 0x300 

6 0х019: dest: halt 


WEA 1-4 ЕЕ Т ДАЛА, X88 9x8. MURRA cR Bm. Яа; 
НЕЕ, AAA HAAR (例如 ALU) 产生 输入 到 条 忻 码 寄存 器 , 市 其 他 部 分 ОИ 
如 分 支 计 算 和 PC 选择 逻辑 ) 又 将 条 件 凤 寄存 器 作为 输入 ， 图 中 寄存 器 文件 和 数据 存储 器 有 分 高 的 这 
连接 和 号 连接 ， 国 为 读 操 作 沿 着 这 些 单 元 传播 ， 就 好 像 它们 是 组 合 还 辑 ， 而 分 操作 是 由 时 钟 控制 的 。 

图 4.23 中 的 代 妈 表明 电路 信号 是 如 何 与 正在 被 执行 的 不 同 指令 相 腾 系 的 。 我 们 假设 处 理 许 从 设 
ЕЛІНЕН, ЖОЮ ZF. SF 和 OF 的 顺序 ， 设 为 190。 在 了 时钟 周期 3 开始 的 时 候 《 点 17， 状 态 
жж РАЈЕ SB LA irmovl 指令 【第 一 行 ) ЕЦ, ЖЕЛЕ КЕ ЖОН. ЖЕРЕ 
色 志 未， 表明 它 还 没有 来 得 及 对 变化 了 的 状态 做 出 反应 。 时 钟 周期 开始 时 ， 地 址 0х00с 载 入 程序 计 
数 咽 中 。 这 样 就 会 取出 和 处 理 用 浅 灰 色 表 未 的 addl 指令 《第 三 行 )。 值 沿 着 组 合 逐 辑 流动 ， 包 括 读 
随 析 访问 存 赃 器 。 在 这 个 周期 末尾 (点 2), 组 合 馆 辑 为 条 件 码 产 生 了 新 的 值 (000)， 更 新 了 程序 寄 
仓 器 名 ebx， 以 及 程序 计数 器 的 新 值 (0x00e)。 在 此 时 ,组合 逻辑 已 经 根据 addi 指令 (ME K CUERO 
做 重新 了 ， 但 是 状态 还 是 保持 着 第 二 条 irmevl 指令 【用 中 度 火 色 表 示 》 设置 的 值 。 

当时 钟 … 升 开始 局 期 4 时 (点 3)， 会 更 新 程序 计数 器 、 寄 存 器 文件 和 条 件 码 害 存 器 ， 因 此 我 们 
用 浅 灵 色 来 表示 ， 但 是 组 全 还 辑 还 没有 对 这 些 变化 做 时 反 应 ， 所 以 用 白色 表示 。 在 这 个 周期 内 ， 会 
取出 并 执行 je 指令 (第 四 行 )， 在 图 中 用 深 识 色 表 水 。 因 为 条 件 码 ZF 为 0， 所 以 不 会 选择 分 支 。 丰 
这 个 周期 末尾 【让 4)， 程 序 计数 器 已 经 产生 了 新 值 e. 2 6 CARE je ib (НА E 
不 ) 被 更 新 过 了 ， 但 是 直到 下 个 周期 开始 ， 状 态 还 是 保持 着 addl 159 (НІНЕ) 设置 的 值 。 

如 此 例 所 示 ， 用 时 钟 来 控制 状态 元 素 的 更 新 ， 以 及 值 通 过 组 全 逻辑 来 传播 ， 足 够 拧 制 我 们 SEQ 
实现 中 每 条 指令 执行 的 计算 了 。 每 次 时 钟 由 低 变 高 时 ， 处 理 跨 开始 执行 一 条 新 指令 。 
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434 SEQ 的 阶段 实现 

TEACH. ПЕНЕН SEQ 所 和 项 要 的 控制 还 和 辑 块 的 HCL Ж. SEQ 的 所 有 HCL fofi 
参见 附 孙 总 的 站 2 部 分 。 EHE. Blei 一些 例 子 ， 而 其 他 的 只 是 作为 续 习 题 。 我 们 建议 你 用 这 些 
练习 米 检验 你 的 理解 ， 基 这 些 块 是 如 何 与 不 辣 指 令 的 计算 央 求 相 联系 的 ， 

我 们 在 这 此 没有 讲 著 那 部 分 SEQ 的 HCL 描述 ， 是 不 同 整数 和 布 水 信号 的 定 美 ， 它 位 可 以 作为 
HCL 操作 的 傅 数 。 其 中 危 括 不 同 硬件 信号 的 名 字 , 以 及 不 同 指 令 代 妈 的 常数 值 , 寄存 内 名 学 和 ALU 
BE. адд ЯАНАА К, АЕ ОЈ, ЦАА ЫЈ, 


t x 
Ü 


INOP 


nop 18 7 f 1608 





IHALT | halt $A F [A A ES 
IRRMOVL 2 теуі 指令 的 代码 
IIRMOVL 3 mov] fü E) PCR 
IRMMOVL 4 mmol fi $84 693 
IMRMOVL 5 mrmov] Jš IPM ERG 
]OPL 6 整数 运算 指令 的 代码 
UXX 7 БЕІН КИК 
ICALL $ call £r ШЗ 
IRET Ú ret fü КЕЕ 
IPUSHI. à pushl JKS RHEI 
IPOPL b popl 指令 的 代码 
RNONE TB fig RC FH o 


8424 НСІ Ж#Н RS TB 
XX EE dS XR P RETE 0955. TAR ID И Ж ALU 操作 。 


除了 图 416 一 图 4.19 中 所 示 的 指令 以 外 ， 我 们 还 包括 了 对 пор 和 halt 指令 的 处 惠 。 这 上 师 条 指令 
都 是 向 单 地 经 过 各 个 险 段 ， 不 进行 任何 处 理 , 除了 要 将 PC 加 1. 我 们 不 会 介绍 һан 指令 实际 上 如 何 
РАА ЕНЕН r. АЕ Ж ЯҒ icode ІР, ЖЗА РЕ. 

ШІН 

ШІН 4.25 Bros, АТЕЙ ЕТЕ IE ФАН ИЛЕШЕ! л. VJ PC 作为 第 -个 字 节 【 字 季 0D) BAL, 
xi P Roc NEAR RARE. ЖЛЕ ПЕ НА ТИ. (被 标 与 为 “Split” 的 单元 ) 分 
^S PS Е icode ЖІ ifun. WHE icode 的 值 ， 我 们 可 以 计算 三 个 一 位 的 信 生 ӨНЕ RD: 

instr_yalid， 这 个 字 节 对 应 于 REHAB) Y86 指令 吗 ? А ҰМАННЖЯН ЖӘН ЕУ. 

need regids: 这 个 指令 包括 个 寄存 器 指示 符 字 季 吗 ? 

need valC; 这 个 指令 包括 -一 个 常数 宁 吗 ? 

让 我 们 再 来 看 一 个 例子 , need_regids 的 HCL 描述 只是 确定 了 code HEETE :条 带 有 寄存 器 
指示 值 池 全 的 指令 ， 


bool need regids = 


үү" 255 





icode in [ IRRM3VL, ICEL, IPUSHL, IPOPL, 
LIRKMOVL, IRMMOVL, IMRMOVL }; 


xxxe Huan rA ІН val 





E425 SEG MARRE 
РСЕ АНЕ. ДІР ЕРЕН ACIE И, ENEATS, RI LIEBER THEAC ER. РС vip, 


ЫШ 4.14 
5d SEQ 实现 中 信号 need valC H HCL (624, 


TH 425 Foy, ТВЕН Н E ЕЛЕЕ HEC FREUE RICE REB Au, 
КЛ “Ан а" 的 硬件 单元 会 处 理 这 些 宇 节 ， Brei ^d d EBAY I SHE 
need regids Jj 1 时， ҮЗІ 被 分 开 歧 人 寄存 器 指示 符 rA 和 t ЖЙІ, 这 两 个 字段 会 被 设 为 g 
LRNONE), 表明 这 条 指令 没有 指明 寄存 器 。 回想 一 下 CB LOO, FERE UH ТЕНЕННЕШІНЗН S, 
SFERT ENS- ERREA 8 (ЕМОМЕ). 因此， ИАТА S rA MBAR, ЖАНЫ 
者 我 们 想 要 访问 的 寄存 器 ， 要 么 表明 不 需要 访问 任何 霖 存 器 。 慰 号 为 “上 Hen” 的 单元 还 产生 常数 字 
valC. 根据 信号 need regids 的 值 ， 要 么 根据 字 节 1 一 4 来 产生 час, Ж АШЕР 2—4 来 产生 ， 

PC 请 加 器 Cincrementer) ВЕДЕ sc НЕ ЙТІН PC EL AL PT 8 need, regids 和 need valC Й, 
产生 信号 valP. 对 于 PC { p. seed regids (fi r 以 及 need valC (Ñ ji， 增加 器 产生 值 ptr+ 者 。 

Me Rs HERE 

ЇН 426 rii T SEQ PARANA EIE BLEU SLT ERE. GEI RP 成 联系 在 一 起 是 因为 
БАП 22 кай 

WiFW TIN РАЗА СО, C kEEJPTitiri СІЕЖПАНВ F) HATS СЕП ЕН 
M F), РАП НИНЕН Ж. HEI —4-Ж4ЕЖ ID. ШЕЕ 3 3288 
Fh. AEGEA ЕТЕТЙН (ЭНЕШГІЖІН), 也 可 以 作为 它 的 输入 字 (wU пж). 
Wi EW ПИЯ А. Ж acA 和 sreB， fo PT SD eS, А. Ж dst 0 амв, ШІМ Аның 
ПЕЙ ЗИН НВ САМОМЕ), ИЖЕ ЕН ЖЕ. 

Wi Р icode 以 及 寄存 器 指示 值 rhA Ri rB, ІН 426 A BIS IN AI B EHAR ТЕ 
А ХЕЕЕ ID. ЖҒНЕ ID sreA ЖАНЕ PE CIEN Ше vala. Br SEES LAE ke ab 


256 $a 


Xx"), HIPH 4,16— PL 4.19 中 证 码 阶 段 第 一 行 中 也 示 , ЖЕТПЕ Ж ELLE GELT TF H W:h SK thai 
F 面 的 srcA 的 HCL 描述 【回想 一 下 RESP Жер 的 寄存 器 ID): 
Int: вгеА = | 
ісойе іп í IRBMOVL, IRMMOVL, IOPL, IPUSHL | + rA; 
1соде іп { IPOPL, IRET } : RESP; 
| : RHONE: # Don t need register 


val valB valM valE 





icoda А 8 
6425 SEO ЕНШЕ 


БОТЕН. ПЖРТЕПНЕНтШЫН ТАН САТАНА TD) FW ШЕШ. АЖЕК РЕНИН ЖЕ 
ҰША 和 wB. ЇЇ TELUR valE К valM TE a ti Fl i, 


з) 4.45 
FARITE sieB ААА ДУ A E vB. 8$ £60 8 4165-10 4.19 P Н 
I X, — Hob HRS CN H aah ë НСІ Кд. 


"ire ID dstE 表明 写 端 口 E 的 目的 寄存 跨 ， 计 算出 来 的 值 valE ik Ar oB, ШІН 4.16--4.19 
中 写 回 阶 段 第 一 个 步 杜 所 示 。 烷 癌 所 有 不 同 指 他 的 目的 窗 存 右 ， 上 就 得 到 下 面 的 届 正 的 НСІ. ЖШ: 
int dstE = | 
icode іп | IRRMOVL, IIRMOVL, IOPL ) : rB; 
lcode in [ IPUSHL, IPOPL, ICA&LL, IRET ) : RESF; 
1 : RHONE; # Пол” E need register 
|; 
ЕСЕ 4.16 
FAS IDduM ANYAT МЕНАТА. ug P db ЖИЙ valM ЕТЕ, + 
116-8 4.19 P EE EX ВИА. ЖШ dstM 的 HCL 代 动 ， 


Н.Х 4.17 

АЖ рор Je И ЖАШ ДЕЕ фп. ж popl esp, E Ж M ñ Xu 
SAHN iki. RS ND ЕЕ. ЭТИЛИР. AIR E EE dE 
ің, qh k, Б-КА Siku RANER, АЖИ БЕШП 
LA€-dé44g4, Жатай рата, жап и ЖЫ АКА: 
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кім 

ТАТ REI W ЖЛ ЩЩ (ALUN RAAL 
根据 alufun f Ei W. Р А aua 和 aluB 执行 
ADD. SUBTRACT. AND 3 EXCLUSIVE-OR 运算 ， 
ШИЙ 4.27 Br, xem RCM rp — T dedii 
产生 的 ，ALU 的 输出 就 是 valE {4%}. 

ТЕН 4.16— I 4,10 中 执行 阶段 的 第 一 个 步骤 给 
出 的 就 是 每 条 指令 的 АШ 计算 。 列 出 的 损 作 数 aluB 
En. EME аша, FRATRE subl ЖЕ 
valA M 3: valB ТИТО A. RETE 595 904. aluh E427 SEQ EIE 
的 值 可 以 是 valA. valC, Ho R-4 ач. ЕЮ  MUSSAERENBABUME. Ела. 
ШЯГЕШЮЛ SORGE E aA NUMERI: maaa a КИФТ, 

int àluA = | 


icode in | IRRMOVL. ТОР, ] : valA; 

icóde in | IIRMOVL, IRMMOVL, IMRMOVL | : valc: 
icode іп | ICALL, IPUSHL } : -4: 

¿code іп | IRET, IPOPL ) : 4; 

Ë Other instructions don't need ALU 





l; 


ЈИ 4.18 
EWR 4.16 - 8 19 РАНЕНИ — p 5 ЕН, E SEQ THEE шай 的 HCL Ж, 
AE АШ ТЕК ІТ THEE. ЕПТИННЕЙЯЕЕЛШЕМЕННІЗ, ЖИ. CT OPI 
f, BEER ifun 字段 中 篇 码 的 操作 。 国 此 ， 我 们 可 以 将 ALU ЕНІН HCL ЖЕНШ. 
int alufun = | 
ісәйе =e ТОР, ; ifun; 
1 : ALUADD; 
l1 
WITH BERN RSAT, REIH RHH ALU BS Е р РЕ ЗС 6А 
TM RU ES. ЖИ. ПАШАТ OPI 指 专 时 才 设 置 条 忻 码 。 固 此 我 们 产生 了 一 个 
信号 set ec 来 控制 是 吾 读 更 新 条 忻 友 寄存器: 
bool set cc = ісейг іп [ IOPL |; 
| ел “как” FREE л. SI ES SSH GEHT. ЕН Е 
+ PERDE) PERG Bo. ИЯ SH €E—*BPIBA4 Goode 8T IDOO, T HAUS 
angkat ET CN UE Пип dO 表明 要 选择 分 去 OB XUHGID BB. О ЗНАНЬ. QÑ 
RRRA TEE BE. 
Wi tem B 
TABIRI ЖК ДЕЕ ГЕ БЕЕК. ПН 428 POS. БЛЮ "E E GE D ch A d i 
SUARUM (ХЭ) МН. 5) 5p АА СЕННЕН АТИЕННЕН ЕНЕ ЕТЕНЕ. Sk 


258 ЖЕ; 
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428 SEQ БИШ 
Bad mb"; hulu ik n Тіл Uri Boe P ГІЗ ТД чам. 


ҚАМ РТО P AE OA НЕЧЕН a 16— [B 419 PLEBE RUP Н ЖТ. TERREN 
ARATE NE B EE valE V valaa ТЕ HCL 描述 就 是 : 

[nt mem addr s | 

Lcode іп | IRMMOVL, IPUESHL, ICALL, IMRMOVL ) : vàlt£: 

ісесе іп Í IPOPL, IRET } =: valiy 

й Other instructions dàn t need address 


з] 4.18 
"LAE 4.16- HL 4,19 Pp m Bu a d ARE. ГЕ ЕЕН НЕЕ Ë valA 
Қ vaP. БІН SEQ FHE mem dara 的 HCL ALI, 


ЖПБ И S A НЕ ЖИН HERE FEES mem read. H] HCL 代码 表示 就 是 


bool mem read = icode in ( IMRMOVL, IPOPL, IRET |: 


278 4.20 
BAR LR АНБЕК ddp ЕНЫН mem «write. 写 出 SEQ 中 信号 mem write 的 
НСІ. Ж.А, 
更 新 PC HERI 
SEQ Ж i ТР РК ЕЖЕТ ШИНЕ ЇН (ЕҢ 429). ШЕ 416—108 4,19 rh: I SDN 
T, ЖА ЇНЇ ЖОНИНЕ ЕТЕД КУ. ЕИ PC 可 能 是 ІС. valM # vaP. FH НСІ. 来 描述 这 
ELITS 
int new pc a | 
íf Call. Use instructior constant 
icode == ICALL : valC: 
f Taken branch. Use instruction constart 
icode == IJXX БЕ Bch : val; 
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š Completion of RET instruction. Use value from stack 
icOde ша IRET : valMH; 

# Defauit: Use incremented РС 

1 : valP; 





која Bch val мам чат 
429 SEQ 更新 PC 阶段 
namen Ed. АЗА val. val 和 var til F— PC ЇЇ. 


现在 我 们 已 经 浏览 过 YRS 处 理 器 的 一 沾 完整 的 设计 ,我 们 可 以 看 到 , JETER RE 
所 竺 的 步 要 组 名 成 一 个 统一 的 流程 ， 就 可 以 用 根 少 量 的 各 种 硬件 单元 以 及 一 沾 时 十 率 控 制 计算 的 碳 
序 ， 欠 而 袜 现 各个 浆 理 器 。 趟 过 这 样 一 率 ， 控 制 还 辑 就 必 堪 要 在 这 些 单 元 之 问 路 由 悄 号 ， 并 枫 据 指 
令 融 型 和 分 支 条 件 产生 适当 的 掉 制 信和 号。 

SEQ МЕ НИЖЕ ҚИТ. ep PROCHE HERE. UL e E EIN P E ME PET RI DI. 
让 我 们 来 看 看 处 理 一 条 rec 指 信 的 例子 。 在 时 钟 周 期 起 的 村 ， 从 更 新 过 的 PC 开始 ， 要 从 指令 存储 器 
ЕНИН. УЖЕШ ЕЧЕН. АШ ЖИРНЕН. ЖТ ШЕ ЕЕЕ 0 E — M. 
ЖАТАН ИЕН ШАН. ЕТЕГІ ГІ EXEC FL AR 2 SE 

АЁ SCB ri We АЕ ВАН ЕА л, DOS MET oo D eer gp BERE rp qti 
用 ,我 们 会 看 到 引入 流水 量 能 获 担 更 好 的 性 能 ， 


435 SEQ+ 重新 安排 计算 阶段 

作为 到 流水 钱 化 的 设计 的 一 个 中 间 步 邓 ， 我 们 特 重新 排列 这 六 个 阶段 的 顺序 ， 恒 得 更 新 PC Bf 
段 在 一 个 周期 开始 时 执 太 ， 而 不 是 结束 时 才 执 行 ， 这 样 产生 的 如 再 回 设 计 称 为 SEQ4， 国 为 它 扩展 
了 基本 的 SEQ MES. ЖШН ЕЖЕН, НЛ ЕИ PC ШЕШЕН RES E 
ЖЕР [对 条 忻 转 于 来 说 )， 或 者 读 访 存 阶段 中 的 返回 值 [对 те: Ж). 

ШІН 430 所 示 ， 我 们 能 称 动 PC 阶段 ， 司 得 它 的 运 辑 在 时 昼 开 始 时 活动 ， 计 算 上 要 前 指 专 的 PC 
f. BERT PC 俏 就 可 以 输入 列 取 痢 阶 段 ， 剩 下 的 星 理 就 和 前 面 讲 过 的 一 样 礁 硅 下 去 。 在 时 悖 用 
Misc dy. ЖШТШ EH WS PC 值 所 需要 的 所 有 的 信号 。 这 些 慎 放 在 一 蛆 寄存 踢 中 ， 
图 中 是 用 标号 为 “PState” (fÜ “previous мше") 的 方 柜 来 表示 的 。 现 在 PC ИШТИ ЛЕШ T 9) 
当前 指 他 选择 PC 值 ， 而 不 是 为 下 一 条 指 地 计算 更 新 了 的 PC. 

[Н 4.31 给 出 了 5EQ+ 健 嵌 的 一 个 更 为 详细 的 说 明 。 我们 可 以 看 到 ， 它 包括 与 我 们 在 SEQ 中 用 到 
m 421) 一样 的 硬件 单元 和 控制 块 ， 只 不 过 PC 还 辑 物 到 了 底部 ， 从 前 面 一 条 指 入 得 到 的 时 里 
存放 在 图 中 底部 所 示 的 将 存 回 中 ， 它 们 的 标号 是 它们 所 保存 的 导 前 面 加 上 一 沾 前 刻字 母 "pO 
" previous ^). 
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VAIA, wali 
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9-430 二 司 + 的 抽象 规 图 
ТМ, SB P PEIB (PC) HARLEEN ENHAN. А 


ТЕЕ ИШЕ ЕНШ. ее 
SHERNAN- TERREA 


ir di ы, 26} 


INED. пыс o mmm èë занит шыс = тис ы = Е ЕЈ Ы i" Б „m x = = = mex umen 


iH EI 





"99 


| ТЕТІ PG 


кн 









ЯНВ | 


(PC) | 
1 
| pus на аа Гры 
IL 


Ж 43! SEQ Aa HA 


ттт ане, 


МЕННЕН ВЕ ЕЕ SIE Т РСИИЯ, ЕЕЕ СИУ. ААХ АЯ РВЕ 
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ІҢ T SEQ 和 БЕСТЕ PC HAHA, 





cede ch ЧИС чым жар peas [те ЕТА 
BRAIN. РА Ар ТЕ — ВИЈЕК Wak Ж. {ЕН И ЖН! Ж АД M E EM. PC rl PLE IH FE RI 
ГІШ. АИ ДЕ 16 ЖАЛИ. ЖО AR R BE (circuit eumig). MENRE Г — tR 
АҚЖ. НЕЛАЛЛТЕТИРЕІТА. ШЕШ ЖЕ ТАТ ЕРЕ Wm. 
int ре = | 
# Cali. Use instruction constant 
pleode == ICALL : palti 
8 Taken branch. Іше instructions constant 
plcode == IJXX && pBch : palt; 
Е completion of RET instruction. Use value from stack 
plcode zz IRET : pVAlMH; 
й Default: Use incrementaed РС 
| + pvalPi 


BH3k A ËJ А.З TEE 5ЕО-ІНЕ НСІ, #136. 
€f. БЕОФЕРСЕШЕ? | 

SEHA — КЕНЕН Ё. илаа нки. ял, ЖА 
ФЕТ HE SE bei PC 0. iE CE T dd ARNT 
В ISA HR repr Samo REX ВИННИ. „жен Ел АДАН ИДЕТ. 
бп ЖЖ A г Kok SERE X АТИНА, дт ЕН ЖЛ. ДУ, 
нді, #Ж ИЕ) F kia. эипаяакыян?. АПЕР ЕЛ SIE 
ЖМ. 57 ФАШ Я. Cout-of-arder ) € E 4E, i T nap i incide 
Жалы. Si—XEBExmHTOE, 


44 流水 线 的 通用 原理 


(КЕНЕ — To IE] Y 处 理 器 之 前 ， 让 我 们 先 素 看 看 六 水 总 化 的 系 主 的 一 些 通用 属性 
Я, ГЕНДЕ СТЕНИТЕ АА ЕСЕНТА, ЗЕ М 
ARRS. (ENDKELIERIRSEP. ТАНАТ ni TE roO NRI. C bar. ДЖ 
MEHRERE. ЕЖ. MALERE. EERE P. АШИ ИННИИ K.H. Ж. l 
МЕСТ. ЖЕШ EV ETBAEEINIR. TERESA- tA P НИЕ ӨШІН 
ВЕ F— F FB, ФЕ FR ЮНЕ ТЕК E, ИКЕНЕН AS FE R, ІНЕН 


Е LIII. 263 
VERA ЖЕЕ. POE RR, SW E AA AN ИШ АЯНЫЛНЫН, Р — MENT UL 
ЖАИ 7, 通常， 汽车 从 须 以 相间 的 速度 通过 这 个 系统 ， 己 免 撞 车 ， 

流 本 线 化 的 一 个 重要 特性 就 是 增加 了 系统 的 疮 吐 重 throughput}， 也 就 是 单位 时 间 内 眼 务 前 大 
客 总 数 ， 不 过 它 也 全 轻微 地 增加 技 行 时 间 【iatsmey)， 也 就 是 服务 一 个 围 户 需 要 的 时 间 。 例如 ， 自 助 
虎 厅 里 的 一 个 内 需要 补 控 的 压 客 ， 能 往 快 通过 一 个 韭 流水线 化 的 系统 ， 具 在 沙 近 阶 段 稍 做 上 停 贸 。 但 
是 在 钙 水 量化 的 系统 中 ， 这 个 国 客 如 果 试 图 直接 去 米 近 阶段 战 有 可 能 招 玻 其 他 局 客 的 恒 痪 T 


441 计算 流水 线 
让 我 们 把 注意 力 放 到 计算 流 术 上 线 上 来 ， 这 里 的 “顾客 ”就 是 指 专 ,每 个 阶段 执行 指令 的 一 契 分 ， 
[Н 4з Т BW Ж ЖЕКЕ ЖИН T. 它 是 由 一 些 执行 计算 的 亚 加 以 员 一 个 保存 
WAARHEEN. Meri EE E RET PEE fip fa] Га RM ip A s Е Е. CD АОС Е РЕЦ 
器 就 是 这 样 的 一 个 系统 ， 输 六 信号 是 从 CD #Ш ЕИ. EHE НЕНИН W, PET 
(xm. ШЕ WI Hš ЕЩ ЖИН. EeqHESESH—SSIEWBI Ее ЕЕГ ВЈ EE 
ZE, HORS TUSCIA 
А) Ж: XR KE IER 


Heop 
Е = 3.12 GOPS 





B) AK Е 


ОР1' | 


432 3EXOKEREERIIEN EE 
Қ НЕНІ, ЖЕЛІ 300ps HRASTA. 20р PELLIT BIN А d ERG 


ЕМ Ж ҢЕР. НЕБІР (picosecond, ЕЛЕ "p", (SEE 107 8. ЖЫ 
И. ЖАТ ГР, ЖЕШЕТ ЖЕ бор, MURATA қ». PB 432 ш Г — 
ЕНЕ, ЖААЖ BI (pipeline diagram). ЖИН, BEL Ip dS. ОЕР КҖ HRE 
СТЕЛЕ: ОРТ. OP2 和 OP). ЖЪН ЕЛЕ тане НН II. ЗЕН, ЕНЕР 
“ТТЕ BL SEREBI— F. ЕН, ЖЕ {ЕЖЕ EC HI FS H ER. РАД ИН 
ТЕНЕТЗЕНШЕКЕНІ, 





[operaron HOXImcosscond | 
Though — = € E= | z11 HOPS 
pen (20-4 300picosecond — Inanosecond - 


ЖИП pay ЗЕ ОСВЕТЕ (ІШІНЕ GOPS) Е BPP FIXE, ARRETE, А 
HERAT- КІН PER ЛЕКИН ATE Chaency), ЕНЕ, АТТИН 320ps. {ША 
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fn ME. 

H BLR NIE SIEUT PEE - ҮНІ (A. B RIC), ЖЕШ ЕИ 0ps, ШІН 433 Ж 
m. ЕЛЕ ЕГИ 2 ШШ ose PR A E. (pipeline registers. АНЫ ED ра 
TX. Dok Tee NE. ала rp UK ER EE. POR OPI IA A JEN В, 
就 可 以 让 QP2 ЙАНА А T. itat. FD aka F. ВО NP БОЛА, ҖЕТЕ. 

-TAMATEA — EREA. АИС НЕВА А НИЛ EHE 5. ҚМ, OPI 是 
(Er BL C. OP2 在 阶段 В. T] ОРЗ 是 在 阶段 А. 在 这 个 系统 中 ， 我 们 将 时 钟 周期 设 为 100420 120p. 
ЕННЕНЕНЕ ХЕІЛ 由 把 OOPS， 因 为 处 理 一 条 操作 需要 3 个 时 钟 周期 ， 所 以 这 条 流 术 钱 章 执行 时 
MALE 3 120=360рь. 我 们 将 系统 春 吐 量 提高 到 原来 的 333.12=2.67 |Р. IVIR T — pa ft, 
bL R putri fi f СИ 0 3607320=1.12)。 执 行 时 间 变 太 是 由 于 增加 的 流水 贱 寄 存 器 的 时 间 弄 情 。 


А] Wi. ВЕ к 


I ШІН = 360pe 
Жо = 83a GOPS 





8433 MRA tS ПИЕ 
tir = A. B R C. ШЦ + 1209 (ӘЛІН. ШЕК Жї TER. 


442 流水 线 损 作 的 详细 说 明 

为 了 更 好 地 理解 流水 线 是 怎样 工作 的 ， 让 我 们 来 详细 看 看 流水线 计算 的 时 序 和 揣 作 。 图 起 和 4 部 
出 了 前 面 我 们 看 到 过 的 三 阶段 流 本 线 【 图 4.337 ИНЕШ. ЕАС В EOS denm mE, Hook 
КУ (er HR ЕК КЕНЕН OR Esp). ЖД 120ps, (894,0 TF 1, Fha F 
ШИ. 





图 4.34 = ЮЖ ДН 
HEN SE] ETHBEMNIE А TK ТЕА Е — ТАН. 
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之 前 , BER A ЕЕЕ ОР? mñ 65815 98 — РИНЕ IRAN. UR HORE fr mika W 
Sei oh oy E ОРІ ЖИИ АРИЙ. Mit ОРІ FEBEBE B 中 计算 的 值 已 部 到 这 第 二 个 将 水 
绕 寄 存 回 的 输入 。 当 时 和 钟 上 升 时 ， 这 些 欠 入 被 加 载 踪 流水 线 寄存 器， 成 为 窗 丰 器 的 输出 点 2)。 为 
k, ШЕРА MAARTE E ОРЗ ШИЙ. UG ЕНЕ ЁТЕ НЕ (42). 
ИШ ЗАН ik LITT IEEE TRI Ceurved wavefront) ЖЕН. ЧАО НН E 2d 
АЖЕ. 在 时 刻 360 之 前 , S CELERE KH ТЕНИЙ Л. (h 4). НИН ЕНИ, 
ЄТ ЕИ ЖЕЕ — АК ЕЕ ВЕ. 

РАЕВА А Е т, ТЕГШ E ИШЕ ERA EP B RUE E TU. Ts 
Е KH WI БН А. ЧЕНИНЕ E TH TAA EATA 3—2, ШИ ЇР 
нарын, ЕГЕДА BR. fries Ri IH Ц, ТАЕ ЧАГ EIE. ЛИН 
AH: SR ТЕНК. 

ШШЕН} SEQ ap RE E PE idib Саз з VO. ЖЧП EBR FH S mib. ЧЖИ 
ЖИШШ m Hl a КЕНЕШИ ЖЕРЕ ШЕТ. ИНЕНІ ІШІН Eh a FB, А ЧЕТЕ 
ТИКВАТА ТАЕ. ЖН TN. 


443 注水 线 的 局 限 性 

图 4 弘 的 例子 给 出 了 一 个 还 起 的 访 水 线 化 的 系统 ， 在 这 个 系统 中 ， 我 们 可 以 将 计算 分 威 三 个 相 
uxore. ҢОИВКЕЕНЦЕРЖЕНЖЕНІНШЕ -і2-. ЖЕНЕ, ЖЕҢНЕН 
KE ROCK Ж. 

不 一 致 的 划分 

[Н 4.26 展示 的 系统 中 ， 和 前 面 一 样 ， 我 们 特 计算 划分 为 了 三 个 阶段 ， 但 是 通过 这 些 阶 段 的 延迟 从 
Sps 到 150ps 不 等 。 通 过 所 有 阶段 的 延迟 和 仍 找 为 300gs。 和 不 过 ， 我 们 运行 时 钟 的 速率 是 由 最 慢 的 阶 
Сеа НЕ Е е). ІШЕ ЖЖ ШЕННЕН, ІНЕН, НА ШЕЗІН (HPH WE Ж 
3) Mps, ЕЕ С 会 空 用 Sp. RAWA B z— NATU ME. RE AA A ИЕ А 
150420«170ps, ЈА Н Й 588 GOPS. 另外 , ІНЕН Т. 执行 时 间 也 增加 到 了 510p: 

дү. СН, GE Bf ИЧЕ 










ЕД ШїН-510рв 
| 而 呈 量 = ESEGBDPS 


Hw 








H43s AT- ЕТЕ ЕТА REIS CU SEHR IHRE 
RIF it W Sh MERE FEET CURE RR 
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AERIS. ЖИИ REIHE RUE RH IT GRISE Ж —4 E HAGA. 通常 ， 
TERTS ло, ШО ALU ЖҮРЕ. Smeg rg e T ups. ixi ien 
ti sit —i aod RE AERE HH ЕТТИК HR LES Y86 处 理 器 中 ， 我 们 不 会 过 于 英 注 这 一 野 
次 的 锣 背 ， 但 是 理解 时 序 忧 化 在 实际 系统 证 计 中 的 重要 性 还 是 非常 重要 的 。 

КӘ 421 | 

ПЕАТ 432 Фе ШЖ, Aap T Sk 6 HR. ЖЖӘАЖА-Ғ, MAK O D| 
80. 30. 60. 50. 70 # 10р. FHMF: 

BO ps 30 ps B0 ра 50 pa 7098 10рв 23ps 





Жз kaka ML A SRA Л.В. РА HG АКЕНЕ k. WA TT R KN 
БАБ, ЕЕИЛЕНИЯА ЕЛ (N SU TER) ЕЕ Ж бе Жин, Hb ibn 
HERA 20ps. 

А. RB ^ — p dE LESE НИЕТА ERE Ж.И CE Әл АЖЕ! 
do # odi Erap ju] Ж R Уу? 

B. £4 КЕНАН MES TEKI d eR TEES UN Яо Eden 
2$ 

C. ФАНИ НАКА НВ АЕ ЯН ТЖФАННЕТЯЯ)! 在 吐 量 和 执行 时 间 
& $ y) 

D NH- +£ eE X Ri, УЖ ЛЕНИ? SB K FRA EO ЕЙІН, 

ЖЖ. medi FB 

Н 4.37 E TD POR А Е, кент, REHAT 6 TEB. B+ 
ГИРЕ 50рв. (Ef IE ELA fn АИКА ИЙТ ЗАКЕ. d ЖЖ ТЫ 
НИН 50+20=70рв. denti 1429 GOPS。 因 此 ， 通 过 将 流水 斌 的 阶段 数 加 倍 ， 我 们 特性 能 提 
WI 14.29033=171. ФПИ SET iE НЕНЕН ИНЕ T. (Ei Tk R 
aus. f NDS. IX EIN ГЕКЕ BEREIT НЕ. ІШЕТІНІН, D+ 
SEIS Т XEM Sh ШИШЕ) 285%, 

ШАК A T deme ЕЕЕ, ЖИ ПЕШ CIS 或 更 才 的 阶段 1 dick. ШЕЖЕ 
НАТ LB E paki ЕШ. ЗЕЕВА а Н. rh E МӘНІНЕ 
ЖӨ. dci ПЕ ЙЫ. ЖИЙИ ЧЕ АНИНЕ НН. ШШЕ 
个 必 片 上 同时 改变 ， 所 有 这 些 者 是 设计 高 速 补 处 理 器 面临 的 挑战 。 

51 4.22 

ATA RE 432 PHE. РЕАЛЕ Е КЕНЕН. FARRA AL, m 
ЖК АКА ТАЕ ШЕ Ж ps. &c de EUER /ж? 
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Жірв Біра рї Юра 





时 冲 Hip — ru = 14209 GOPS 


4.37 ШЕН ИКЕН I ЛИНЕ 
ipi patula, dup Rc EE EK Т ЧЕНЕ. 


444 ТЕФПЕЖЕЖІ 

n Hai. ДААН ВЕ РЕНЕ, ЕтЕеЧАЯНИЯЖ, 无 说 是 汽车 。 A EEG. 
相互 部 是 完全 独立 的 。 GRE. w TIR ТАЗ? ER Yee IXIESRTTELEEREIE ЖИ ЖИ. iH R >> ШЕ 
ПЕНЕН, pis. АЙЮ FRASE ҮННЕН; 


1 irmovl $50, (%гах 


+ adil (beby 
% — mrmovl 1004 |, %ейх 


EATER ЖШШЕ РЇП, BEHHHSEIHE Н АН K (data dependency). Aeh H 
MEA AIL [8] T E ЖЖ. immo ЕО CE PENARE emn th. ЖЕ 
add] fid (38 17) 要 读 这 个 值 ， 面 addl R d E ПНЕ EFC Eel P, mrmovl 指令 CRT) 
zs TL 

3 EXEC E SAARA Cequential dependency). ЖЖЖ FIE R T- Y86 JH 
他 序列 ， 





1 loap: 

d subl fed, tebx 
J jne targ 

4 irmovl $10,T]edx 
: jmp leep 

б сагу 

7 halt 


jne dR CR ТОУ PET —THESMIBX (control dependency), HA & PEM GL EE E ds E 
{ИТИ E. movl Jš Ойт) 还 是 hal 2 (CLH), 在 我 们 的 5$EQ 设计 中 ， 这 些 相 甘 
ap di REP KR S. НМ 4220 的 右边 所 未 。 这 些 反 情 棉 更 新 的 寄存 蜘 值 向 下 传送 到 寄存 器 文 
fF. SERIE PC 值 传送 到 PC НЕЙ, 

图 4,38 华 例 说 明了 特 流 本 线 引 六 井 有 芭 馈 路 径 的 系 赃 中 的 危险 ， 在 原 这 的 系统 CAD p., 8 
ЛИЕВ) ЖАНАШ Е-Е. ЖНЖ (B) 就 说 明了 这 个 情况 ，OP1 КЕНІН OP? 的 
葵 六 ， 依 此 业 推 ， 旭 果 我 们 试图 将 它 转 换 成 一 个 三 阶段 请 水 斌 《CT7， 季 们 将 改变 系统 的 行为 。 如 
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ИЕ Н (C) pae, OPI ЇЧ OR S ОРНА, ГАНИЖАН ЕН, ІІІ 
RANITA. 

aW KEE ТА Үй ӨЗЕН, MSF ЕТЕ И ЫЙ. HA. ШІН 438 
PETERE REED h ДЕ salita. ЖП АШ ЖЕ Л А ЖАНИ n ТРЕ 26, 
以 恒 得 到 的 行为 与 ISA ox POP RT. 


А) Wit. КАЯН. “қия 





ae 





ын) 


с) B. mun mH 





ЖЕ 438 ШЕ BURXOR RIDER RES R t 


tr V ЖЖ ЕЕ ЕЛЕП ЕЩ CAO И ЖИЕ ЖЕ іс) өзгер, # ЕТ EISE EGER S. TELA 
"am вр» PAER. 
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4.5 Y86 的 流水 线 实现 


我 们 终于 准备 好 要 开始 本 章 的 让 要 任务 一 一 设计 一 个 流水 线 化 的 XY86 АНАТ. 我们 开始 时 以 
SEQ+ 作 为 基础 ,在 各 个 阶段 之 间 添 加 流水 线 寄存 器 , 我 们 最 初 并 不 尝试 正确 地 椒 理 不 同 册 数据 和 和 控 
制 相 兴 。 不 过 ， 经 过 一 些 收 改 ， 我 们 将 达到 目的 ， 得 到 一 个 实现 ҮВӨ ISA 的 、 有 效 的 、 流 水 线 化 的 
处 理 器 ， 


451 捅 入 流水 线 寄存 器 

在 我 们 创建 一 个 流水 线 化 的 86 处 理 器 的 最 初 尝 试 中 ， 我 们 要 在 SEQ+ 的 各 个 阶段 乙 间 插入 流 
水 线 帘 存 器 ， 并 对 依 号 重新 做 了 排列 ， 得 到 PIPE- 处 理 器 ， 这 里 名 字 中 的 “- ”代表 这 个 处 理 器 和 
明 终 的 处 理 绥 设计 相 比 ， 性 能 要 差 一 点 。PIPE- 的 抽象 结构 如 图 4.39 所 水 。 流 水 线 寄存 器 佬 说 图 下 
用 浅 黄色 方 框 表示。 每 个 寄存 器 可 以 存放 名 个 字 节 和 字 ， 待 会 我 们 会 看 和 到。 可 以 观察 到 PIPE- 使 用 
的 硬性 单元 与 我 们 的 两 个 顺序 设计 : SEQ СЕ 4.20) 和 SEQ+ (图 4.30) 完全 一 拌 。 

ЖЕБЕП ТЛ X ES 

F 保存 程序 计数 器 的 预测 值 ， 待 会 儿 会 讨论 。 

D 位 村 家 指 和 和 解码 阶段 之 间 。 它 保存 关于 最 新 取出 的 指令 的 信息 ， 即 将 由 解码 阶段 进行 处 班 。 

E 位 于 解码 和 执行 阶段 之 间 。 它 保存 关于 最 新 解码 的 指令 和 从 寄存 上 器 文 件 读 出 的 值 的 信息 ， 
即将 出 执行 阶段 进行 处 旦 。 

M 性 于 执行 和 和 访 存 阶段 之 间 。 它 保存 晤 新 执行 的 指令 的 结果 ， 训 和 将 由 访 存 阶段 进行 处 理 ， 它 
ИТТЕН РЕНАН ЕЖ TORIA 3H ERES SRL. 

W МРТ БЕ ЕСІН, F WWE ei r LH ЖЕНЕШЕ ҰЛЫН. TAS 
ret 指令 时 ， 它 还 要 向 PC 选择 逻辑 提供 返回 地 证 ， 

图 4.40 表明 的 是 下 面 这 段 代码 序列 是 怎样 通过 我 们 的 五 防 段 流水 线 的 , 其 中 对 各 条 指令 的 注释 
H H— 5 Ж Жл: 


1 irmov] ©$],%еах # Il 
2 irmovl S$2,*ecx # 12 
4 irmovl 53,Жейх Я 13 
4 irmovl 54,%еох 9 ІЙ 
5 halt # I5 


НД ТЕ МЕЛЕРІ ЖАН. FJ 44 节 中 简单 流水 线 化 的 计算 单元 的 流水 线 图 一 
il 这 个 图 描述 了 每 条 指令 通过 流水 线 各 个 阶段 的 行进 过 程 ， 时 间 是 从 左 往 右 增 大 前 。 上 下 而 一 条 数 
学 表明 各 个 阶段 发 生 的 时 钟 剧 期 。 例 如 ， 在 周期 1 取出 指令 了， 然后 它 开 始 通 过 流水 线 各 个 阶段 ， 
到 贿 期 5 结束 时 ， 其 结果 写 入 寄存 器 廊 件 。 在 周期 2 取出 指令 11， 到 周期 6 结束 时 ， 其 结果 写 问 ， 
以 此 类 推 ， 在 最 下 和 而， 我们 给 出 了 当 周 期 为 5 时 的 流水 线 的 扩展 图 。 此 时 ， 每 个 流水 线 阶 段 中 各 由 
一 条 指令 ， 

处 图 4.40 中 , 我们 述 可 以 看 到 我 们 画 处 理 器 的 习惯 是 合理 的 , 这 样 ,指令 是 自 底 向 上 的 流动 的 。 
周期 5 时 的 扩展 图 表明 的 流水 线 阶 段 , ИЕ ТЕЛЕС АВ, 写 回 阶段 在 最 上 面 , 正如 流水 线 硬件 图 (图 
4.30) 表册 的 一 样 ， 如 果 看 看 流水 线 各 个 阶段 中 指令 的 顺序 ， 就 会 发 现 它们 出 现 揭 顺序 与 在 程序 中 
列 出 的 顺序 一 样 。 因 为 正常 的 程序 是 从 上 到 直列 出 的 ， 我 们 保留 这 种 顺序 ， 让 流水 线 从 下 到 上 进行 。 


MILII 7] 


tc TE ТА ТАННІН, ET Tmemam. 


W. icode, W М W valE, W vaji, W delE, W dall 
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КЕ 4.39 РІРЕ- онй 
ARE SEQ, CHE 400) IPM A GICKRIE EB. REIDUE T TIPS AS. ған, RM. Мет: JU k тіні! 
а. А 
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LET £1, x ËI] 
Ертю] Fl. еск #12 
irmyr] £3. Vedx KIJ 
irm l Ëq , aha Т4 
Bal: 邮 了 号 





图 440 ECOUTER TUM 
441 给 出 了 一 个 更 详细 的 PIPE- 定 件 结构 的 说 明 。 可 以 看 到 坏 个 广 末 线 害 存 器 包 千 未 个 宇 也 
(НІНЕ Яо, 对 应 于 与 不 同 顶 售 通过 流水 弃 有 关 的 悄 号 。 与 两 个 顺序 处 理 器 的 硬件 站 构图 
421 8 431) 中 用 团 角 方 杠 囊 示 的 标号 下 同 ， 这 些 白 色 方 杠 代 表 实 际 的 硬件 部 件 。 
比较 SEQ SEES MS CPU 4.30) 和 PIPE- 的 抽象 结构 СЕ 4.397. RURALA e 
NLIS НЫ. {НДЕ Ж —4+Е PS. ЕЕЕ. ЕП ЫЫ, 


452 ЖШЕЗІНТЕЙН ЗІНІ 

SEQ«— А — ded e. ЖЫШ valC. sA 和 valE ЕНІМ epe i. dedi 
ИНИ. АР ЕЕ И ЖК S tS., AERE. Иш. Æ PIPE-W WR ІН, 
НАЗ “кәй” Bf Be Se. Bud P Toe Ell 4 M icode 信号 (N 44D. ПЕН 
Cds ШЕЕ И AE IEEE. To E EIER, Яш, 4 ЕТЕ R EA 
六 一 条 指 寺 指定 的 目 交 寄存器 中 。 在 我 们 采用 的 仿 省 机 制 中 ， 通 过 在 信和 号 首 字 前 加 上 大 写 的 流水 
Hm mem F °F TE АЕН, REELE— c ЕКЕЖ ЖЖ ЕШР ИА E. BO. I^ code h 
Жажа D icode. E icode. M_icoda 和 W icode. 我 们 还 需要 引用 某 些 在 一 本 阶段 肉 刚刚 计算 
ЖЕНУ. ПЕ Ref S КЕЛЕТІН ЕК Ы ЕРЕ КН, PIU d sreA 
Kl е Већ, 

SEQ+#I PIPE- 的 解码 阶段 部 产生 信号 det 和 dsaiM, ТОВ ЕЙ valE 和 valM 的 目的 寄存 器 。 


е K tk ab I 273 
在 SEQeP, ЖП ЕНА Е W £w rak kp W ПНЕ А. TE PIPE- P, SEMUR 
ih АЛЕ phiru Er, ИГЕННЕ АЗЕ aW FW ТН (WL SK DEL TERRI 
Га о, Riki IET mie Н Ж ПАН REN A EX BIB —Ж ИНФ. ЖІ, ЕНИН 
[ШШЕН ИН? ШП А, fms r2 ID ЖН РАА РВУ. ЕЛ-ЖЙНЕШ, RATR 
I HABT ЖЖБИ ВЧ И РУ ЕТЕ TE BL. 


|: 






| TEAT = ЕГ E= 


zm тәй 


В 4.41 FFE- 的 硬件 辣椒 ， 一 个 初 闪 的 流水 旺 化 的 实现 


ШЕ гиа Н ТП, 


PIPE- 67 — TR IB MEIST AE OEC БЕСА RAN. IERREEM EXE BEP 0 “Select A" 


274 Жа: 

е Т 

НІК, ЧП Н. WIRA ok HI KS FB D 的 үзір EU, Wr KP А DT HP e dum a 
ФОЕ, ТАЖ ЕЕЕ ІНІҢ ҰША, 包括 这 个 据 是 为 T ЖЬ НЕ КЕИ E ШИ M 
的 状态 数量 。 在 所 有 的 指 专 中 ， 具 有 сай 在 访 存 阶段 需要 vaP 的 慎 ， 只 有 跳 转 指 考 在 执行 阶段 (8 
ЕЗШЕ) 雷 要 valP 的 值 ， 而 这 些 指 李 又 帮 不 需要 从 害 存 器 立 性 中 inm. HERTS 
ДЫК Tri. ЖЕГЕ L8. valA ҖЕ СНЕ, Айй СРО ames mM. 这 
ІНЕМІНЕ T SEQ CB 421) 和 SEQ+ (0431) 中 标号 为 “Data” iih. Px Hb E nie ir] c fe AS (o 
ІЗДЕ, ERPE. ШЕРИГИН FL ЖЕНЕ ЕЩ. Sra id 63 ЖР ҮР ШАК Б 
ШОШ. KOR LAN. 


453 预测 下 一 个 PC 

让 PIPE- 设计 中 ， 我 们 采取 了 一 些 措施 来 正确 处 理 控 制 相关 。 我 们 流水 右 化 的 设计 的 日 的 就 旦 
等 个 时 钟 周期 柄 发 射 issue) 一 条 新 指 考 ， 也 就 是 说 每 个 时 钟 辕 期 都 有 一 条 新 指令 进 入 执行 阶段 并 
езен. РЫНА Н EL ARCHIE ЕН И ЕИ ЕЕ ИШ— Kh. A ГА |Н. H 
[e ҮЕ ІНЕ 92 E. Ч Ей ЕНА w. жен, ІНІН ЖЖЖ 
18%. MULTIS, BAER ШАПИЕВ УК. ПАШ ЕШШ Y, ЖЩ. 
ШЖ ИИ E пос, ЖИИ ЧАТЫ. ЯШЕ [НЫЛ 

ET RIRE AR ret НЫ, ЕЕ ЗЕ СИТЕ ROTEN RE F ES 
Ehi. MET call 和 jmp (ЖЖНҢЕНІ EU F Sk TR A AE ВІ aC, MAFA 
忆 指 针 来 说 就 是 vaP., Eit, Н PC AFA ТЕ КЖ F. ЖИЕ ШЕШ 
HAH- ETE. Are AER, ТИТ ТЕЧ WE. МӘТЕН RiR 
ПОН ЕТЖ. ЖАН PC 值 应 为 кс, ІНІ HERE, ШАЯ PC {ДЕ 
^l valP. TREERE (ПИЖЕШ ЖЕК CREARE RERRUTT RUM EUER. DUE HI е 
ВОСЕНИ РАР ТӨНЕ». RUE E 459 ФИН ЫНЫ. 

ИР ЖОГА НКИ TBI E ЖИД К RU. ES БЕГИНЕН T RAE 
ACTOR. РААТ КЕНИНЕ РЕНТГЕН. ЖЖ ЕЕ Т k 
ЖИТ ЖИДЕ HER. ERNE h. FAERIT ILLE. BULL FUGERE T EP 
因而 预测 PC 的 新 值 为 valc. 

ЯЗ. MENAMER _ 

我 们 的 设计 使 用 总 是 选 冬 (always taken) ç L ñin р, BEC ACH de В 
SOW[3I]. RA, М.Ж МЕ (nevertaken, NT) KW io X Md аж, Я а-ы, 
13 RAE, Ей ЖАНЕ (backward taken, forward not-taken, BTENT) 的 策略 ， 当 分 支 地 址 以 
қанжыға, АЊА оі, АЕА БТ. UE EHE 
AP 65%. ИНАДЛА ARH- ER NICE USE A EROR. REA Tik 
ПЕК, ЖӨ ЖАННИ. BAHTERA ER HE 439 和 440 P. тыға 
Y86 ЯЙ 3 PE SERE NT 和 BTENT dr E CE. | 

二 成 劲 的 分 支 预 出 对 程序 性 能 的 影响 辑 查 下 .12 Фан ET ER ES. 


RIERA ret 指令 的 新 PC 值 没 有 讨论 。 同 条 件 转 循 不 同 , 此 时 НЕМЕНІ LF R ER RF 
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HIE EL ҒӘ, ААГ ЕЕЕ О. EREHE. PIRA GERNE E 
БЕШ. АО ОЕ ЕФ, H| ret 指 专 通过 写 回 阶段 。 在 4.59 节 中 ， 我 们 将 
回 过 来 讨论 这 部 分 的 实现 ， 


ЯЕ. ЖЕНЕШЕ O —— s 

IER BAGUE KL, Jo BS n. NAAMAA ДЕЯН. kika "T 
АЛ ЕНА. SHEABTIRTIAAA, AUDGUPRA— ERA, € 
RARAWA AA d meu, d UTILE FIRE. AALA, HE 
Н, ИААФ ka КЕМ. ЯШӘЕШНЕ. AALAN, ас 


Em ako ek X gU жер... da e чыдар Ят. аалы. x 
ЕЗЕТ И | 


РЇРЕ-ЁФА{ ЕТБҮ. WH 441 КЕЛ. AERA PC Е ЧА, МАХ EGER SE 
际 的 PC. ROTHEN. БӨЗ "Prediet PC CHE PC)" Hias, PC 增加 器 Cinerementer) 计算 
出 的 valP 3UDLEH PT PR ТИН тас rip E. WI ШЕЖЕ ЕР, WEF: 
ҮЗЕР, БӨЛ "Select PC СЕН PC)” ШЕНЫ p SEQ«Í PC 选择 阶段 中 标号 为 "pc" 
HR СЕИ 411), БАЗСЧЕФАН- СЕЛЕН ІШЕЙІН RULES РС, МІЖЕНІККЕЗЕ 
^ XAR vaP HI (ИН ЕАК ЕТЕНЕ М. ЯН чар {ЙГЕ E M vaa th), ШЫҢ 
ret НЕН СІРНЕ W уым) 时 的 返回 地 址 的 值 ， 

ZH HE 459 攻 完 咸 流 本 线 控制 一 辑 时 ， 会 返回 来 处 理 跳 转 和 返回 指 地 的 。 


45.4 ШЖЕНЕ (hazard) 

我 们 的 PIPE-£: f] 0 pt — P OK ЕТЕ) Y86 ШАН. ЯШ. [BA FERAE 4.44 
ИТІНЕ, MEHLIKER BOR IA -MERANER c ӘНІНЕН. SE 
HONESTA. CARRA THINE. НОНЕ Кд, ЖЕН, F- 3382 Ma 
“ЖЭНЕ; Gita. -БЕРЕЙЕК- ЖЕН W, Mina kirpik. AI 
Kiki pah. ШШЕ ВАКА EUER. ИЛЕШ. ПО, Ишни} 
为 两 类 ， ЖЕШ (data hazard) 109 V ME (control hazard)。 在 率 节 中 ， 我 们 关心 的 是 数据 冒险 ， 
我 们 会 将 控制 冒险 作为 整个 流水 厂 挤 制 的 一 部 身 加 以 讨论 (459 152, 

Е 4.42 ПЕН РІРЕ- РЕ ЕНЕСІ prog] EIB Pr pJ EUR SEE PC EL I0 和 3 LAG 
序 寄存 器 edx 和 名 eax, 执 行 三 条 nop R$. ЕЖЕТ BE еі 加 到 号 eax, 我 们 重点 关注 两 条 irmovl 
ЇН Tü addi fii 92 [а 09 rd de XC Tio e n E ER. 在 图 的 右边 , vedi TIE T B ERREUR 
ЖЕН. (FD FO KELIB P eH os ТЮШ 630 7 їй КЕ RR. HOK ERES E BE 6 中 写 回 
Ин НІН 7 (PERS ОО TES IR RH. 在 周期 ?开始 以 后 ， 两 条 imal Е SENE. Me 
W fr КТЕ Т Т %ейх вах ЇЇ. ЕН, 3 add ЕӘТННТЕНМЕРШЕН, =E 
[БЕКЕ Ж ШЕН Р. 在 此 示例 中 ， 丙 条 movi 指令 和 adal 指 寺 之 则 的 数据 相关 设 有 造成 
WWE. 

ATH prog! 通过 流水 线 井 得 到 正确 的 帖 果 ， 因 为 三 条 nop ft A 8 ORC i 
造 了 一 些 延 退 。 让 我 们 来 看 看 如 果 去 掉 这 些 пор 指令 会 发 生 些 什么 。 图 4.43 描述 的 是 一 个 叫做 prog? 





276 | ТЕ: 

ШЕТЕН ЖӘНЕН, (ЕҢ ЖЕН тез RiScax 值 的 inmowl ij + Elika T de FE B E UE 
ШІМ add 指令 之 间 有 两 条 nap fli. АЕ Т ЕЯ 6, IEH adi IR Pk 
ПЕСЕН Е Gmail ЖАННЫН ЕНШІ. 第 一 沾 irmov| HB 
ufi IUBE. КЕТЕЙІН Se 已 经 在 寄存 器 文件 中 更 新 过 了 。 在 该 周期 内 ， 第 二 
T irmovl 指 学 多 于 写 回 阶段 ， 因 此 对 程序 寄存 器 受 eax 的 写 要 到 周期 7 开始 ， 时 钟 上 开 时 ， 才 但 改 
生 ， 同 果 ， 会 读 出 weax 的 惜 误 值 【在 此 我 们 旧 设 所 有 的 寄存 器 的 初始 值 为 0)， 因 为 对 访 害 存 吕 的 
TEREE. ТИНЕ, ТЕЖЕЛЕ ЕАН, 


8 pregi 

Охо: ігтеғі 5ІП,інкік 
Пий0%: ігтеті %1.%ғақ 
Пкй90е: вер 

ПЕПЇЧй: nop 

йїПйш: nog 

йхППї maddl bada, мах 


Dxüll: haic 





val 4— R|veas] = 10 
[= R[1eax| = jj 


m SG CET | 





| 图 4.42 prog! ЖКК. IU OR EE A 
RB 6d. Wd irm HE S AEn. ьа ЪТ PAM RR 国民 得 删 的 是 中 adr Tea EFL IE WIL. 


| PE 4.44 ӘНІНДЕ 3 rimovl 指 地 和 add RAAR —Ж nop 指令, 即 为 程序 prog3 时 ， 发 生 的 
Tis. MERTE AEREE ENT 5 Puit EET 429. Em addi fid ИИИ. PEHE Wd 
ебх ИТНЕ. ПШР вах 的 写 还 和 处 在 访 存 阶段 。 国 此 ，adg 指 坊 会 得 到 两 中 
ДЕШЕ IT S. 
| š 4.45 给 出 的 是 当 我 们 1:86 irmoyl 指令 和 айа! 指令 间 的 所 有 nop ffi. ШОЙТ proga 时 , 党 
生 的 情况 ,现在 我 们 从 倾 检查 周明 4 内 流水 绩 的 行为 ， 此 时 айа РІНЕН. TEHE, x 
Aed: 的 写 情 处 在 访 存 阶段 ， 而 执行 阶段 正在 计算 寄存 加 加 eqx Er. EE. addi HH ІМ 
ЛЕ ЕЕ ДЕЛАЙ. 
дии ТИЯ, ün t —dle o iM EROR RETE D НЫН HEA- ИШ. Бей 


Lm Bk EH _ 77] 
EARNWE. ¿Pri НИДЕ ЕЮ. EARR EIER] ERE RE КИЫН A W Fr s Y ti 
{ФОУ ЕК. Wm ea = ЖИЕ. fitr Spree. Жент NUS POS Р 
W XF. 


8 progi 

Пх000: іттеугі $10.Wedx 
05000: irmovi 93, Вах 
йкййп nap 

йкайй! nap 

Пкй0е! add] жейм, беде 


KÜLÖ: halt 





ы май 





E443 prog2 的 流水 总 化 的 执行， 没有 特 丈 的 流水 起 特制 
ПИЕ ER. ЧЖИ сах У %. Ж ali Їн ИРИНАНЫ ЖИ ЖЕНШ! (|. 


ял. ЭШЕН ЖД 

I-AR Ж IOS Kai Н ү bal kikar, ЖЕШ. Paesi 
AGAR. ЖНА. AAEH, ТЕШ АПАШКА ЬН We TK. 
АЛААБ Annee үн Тт. ший Л Ей IS R ЕЕН. 
кане. HEURE ROT знала тилн. 
 ЖАНЫНтТ, B.T X (ЖИЕН) ӘЛЕН ІНІ #çca n. діНЕЕЕ 
ТҮСТҮ? КЕМИНЕ NERO у Kik СЕНІ, Wu Tt ү. Ж 

ЖАҒЫН: Eh ИКЕ КИДЕ НТ ИТНИ. ТКАНИ ER 
РИ, АНТЕ НЕЙ, E. tP ЕНШ. Hal Wikis Ede met f 
Ж#Н ан, 2 & 4593 jh. 

ЗШЕ: TAN AE Ели КН. В —-FHR AMB INP AREN. 
WAHRER RSHA ALEAR НИТ. 5%. Bir EIE Ed ded RGB 
RPR RENER E, H5d46e4AHÉHEEGRHXE-—[TAREREM. A b+ MES 
Bj ( self-.modifying code) ЕОНИ, ñikun t. ФЕ АН, x 
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АФН, FEARR ANNAA PARIA, яң b A AR АИФ 
желй H ҖИ ҖИ, АТИ, Anm жай Ж. 
iaa f k е акта EF. 


$ prog) 1 2 3 4 5 б 7 à g 
Ож: ішеуі £10, ds 
ТЖПОЕ| irmovi 91 Ymax 
ҮкПФгі пер 
JxCDd: nddl Pix, PTE 
ймОйї: halt 





val& + Ri[vedx| = 057 
valB 4— Н[\оах] = 0 





8444 pogi ВУКАНА Т, ЯНИ ЖЕДЕ И 

EARS. adl Hide A W rB КЕРЕШ ИНИ. йын IDEAE ЧИНИ. АЖЕ сал ННІ, 
КЕНЕН valA Fo vad ЕТІНЕН НЕ. 

455 MØ (stalling) 来 避免 数据 冒险 

暂停 【stalling) 是 一 特 常 用 的 用 来 于 锡 慎 障 的 技术 暂停 时 ， 处 理 跨 会 停止 彼 水 线 中 一 条 或 儿 

条 指令 ,直到 冒 障 条 件 不 再 油 足 。 只 要 一 条 指 信 的 普 换 作 数 会 被 流水 线 后 面 某 个 阶段 中 的 指 他 产生 ， 
处 理 器 就 合 通 过 将 指 地 阻 井 在 解码 阶段 来 避 亿 败 据 冒险 。 图 4.46 prog?) ІН 4.47 Cprog32 ЖШ 448 
(prop4) 就 说 明了 这 项 技术 ， 当 指令 км 处 于 解码 防 笑 时， 流水线 控制 亚 辑 发 现 执行 ， 访 存 或 写 
回 阶 筷 中 至 机 有 一 条 揪 令 全 更 新 寄存 器 %edx ШФеах. ЕНЕ addl SEED IEEE EUR 
过 这 个 卫 段 ， 面 是 会 暂停 指 令 ， 和 将 它 阻塞 在 明码 阶段 ， 时 间 为 一 个 周期 【对 prog2 EO. PETER 
【对 prog3 来 说 ) 或 者 甚至 于 三 个 周期 (对 prog4 案 说 1。 对 所 有 这 三 个 程序 来 说，addl ioe M 
会 在册 期 了 中 香 到 两 个 源 摘 作 数 的 正确 值 ， 屿 后 她 续 治 着 访 水 线 进行 下 去 ， 
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E piigi 

йрй irma] 810, Kedi 
DxGD&:; irmovi @1,%так 
KODE: ail] kedx,teax 
üxÓDe: halt 





Жал; рода ЖЫТ, ОКАН Ы 


ЕНІ. idi М. ЖЕТИНЧИ ЕЮ. ЕТЕ Е еа КПП ЛЕШЕ И. ВАТИ ВЕЧЕ ИЕЛ Чак 的 新 
їй. ЖИЕ ada RO valB Pñ z ЕЙ. 


4 progi 
пх909: 
xijg: 
oh 
йй 


бкійе: 


exülg: 


lrmowl 510, нік 


ттт 81 Шайх 





В 4.46 prog? МЕНЕЕ ВЕИТ 


Е Ч da MARLE. РЕТИ ИЕ TS HE, ИТНЕ Tem itr ipe. v 
Cd BHpHLA UR. ЖЕНЕ? НН 34 ERI. ЖЕ), LIE d HER пор s ШИША 
HAMUT prog] ІНЕ (F 4422, 


F add APREGAR, ЕТО ЗИРЕ АА СЕ К) halt {НИ ЖЕЛІН, Ж 


序 计数 器 保持 不 变 就 能 做 到 这 一 点 ， 这 样 一 来 ， 会 不 断 地 对 hal АТН, IUNII. 
暂停 技术 就 是 让 一 组 指令 阻 赛 在 它们 的 陆 段 ， 而 多 许 其 他 指 亏 维 续 通过 流 未 虐 ， 在 我 们 的 示例 


280 | Hat 





中 ， 我 们 将 addi ЕНЕТІН, iE halt RR ТЕНЕТ ВЕ. FEE 1-3 ЕЕ, IÑ 
让 两 条 irmavl TR С Ж пор fii С prog2 和 prog3 情况 中 ) EHE HET. ЧЕКУ АРТЕ. H 
2, RINER F WA КЕШ addl fiis ВЕЕР A ET AIRRA ДА Е Е. E 
Ки Н Е ЗЕ ЕВЕ ТЕ, SG Kia IE IB A — У (bubble). "ORB T Wap е 
生 的 nop dfi —— Ë Sara. НЕ ЖНА ЕЕЕ ШЕЕ. 在 图 446—8] 4.48 ПЖ |Н 
{ААЛ к. желі, ӘШІН-Т аш НИКА “р” rese v "ET NUT 
ЕНИЙШЕЕТ- КИН. wit Wa ЖЕН. ЕТТЕ РЕ А НА А ТШ, addl IR, 
GERE ЕИ ИЕШЕ МАЕ. dE 459 Yeh, ЕЖЕН ЖЖЖ НЕШ ИЕЛ. Ч 
EIL. 





Е progi 
Japp іттеті 510, Баби 
0006: іттеті 91,%тах 
rite: nop 

bishb а 

bubbla 
UxODd: addl nad Eix 





йаш halt 


图 447 propi mien gh) КЕКЕ UT 
(EIE. 5 9127 addi ЧАН, ЖӨИ И ТН ТИШИНЕН ИЮ. CERTA HMA ЧЕЙ 
Ше Ж MO QR adl (FIER. CPUS CREER. ИНЕ, EATER YM A UB ЗЕНИТ ЖИН 
^k addi (MEA. ERR E. BL IE HE ЛИ пор f. ШИА CLE prod КЖ (W 442), 
E progi 1 B 3 4 5 8 7 8 B ш H 
1ж000: irmovl 810, жемі СЕЛ w 
бкййй: irmew. 53, baa 


bibh a 









(жОбсі 3631 kady, bear Fojo D D|E|M W 


Пейн: hälf 


448 prog 的 使 用 暂停 的 深水 强化 的 执行 
FARA hH ad ЕГІЛЕДІ ІІІ ГЕЛІ Тат ШЕ. 
йз РЕНА add іи. НИК НЕЕ Ta WA BIN, WERTER TH Н, FEE 6 PREM 
> ым! ІНІ. CHARRAR E kaca БИЕ, WERTERA ^C. ЕНІН h EN ER ddl БИН, 
ЖЕ. KB MUR 4 пор ide. ИЕНА AUS ELT: pogl ЮЖ ОЕ 442]. 


ВЕРЕ ЖЖЖИНИ НЕ". ЫГ АЕА Е prog1 4 О 4.42) —}Е КӘ 
m. Hoi] BI ртор2. arog | Е] ргорі. E prog ЖА “АЯҢ, 24 prog3 МАЯ, E 
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prog4 # ^ — "UB, SERLE mov ННІ add 指令 之 间 有 三 条 nop IR. AWANA. M 
(КЭШИН S (EERE 436). ERRERA — 3 h 3 H jk — 4 W 
(сн, WIL Ip tete ИЕ ЖӨНҮ. СЕО ВАТА АЕ ВСЕ, хетт 
u — ҖИ, MERE Y W Pi ІК, 


456 用 转发 【forwarding) Xue iE SE 
我 们 РІРЕ-КННАНЕНЫНЕ М. TET ЧЕ АЕ ШЕК. НЕЯ ЦЕНА ER ТР 
EFREM AIERT. НЕНӘЕННЕН, ТИППЕН НА RR Kik W IF 38 E ФЕ 
ЖШ. Bj 349 用 prog2 周期 6 的 流水 线 图 的 详细 描述 率 说 明了 这 一 策略 。 解 加 阶段 还 辑 发 现 ， 
Жай вах ТЕН valB ПІР, ESMAO E 上 还 有 一 个 对 有 号 eax 的 未 进行 的 号 。 它 只 要 简 
МАЕНА АЕ З) ГТ ЕНЕ OAS W valE) {ЕЛ {ЕИ valB 的 值 ， 就 能 迁 免 暂停 ， 这 种 将 早 星 
值 直接 从 一 个 流 杯 钱 阶 段 传 到 较 早 阶段 的 技术 称 为 载 据 村 怖 【data forwarding. xim Pede so. СЕЛІ 
得 prog2 MIRS We Ni 8 О IH PPE, 
i progi 
ExDDE: irmi STD, тің 
IxüD&; irmcv] 31 Terg 
&xübci mop 
байы! тәр 
тайпа; а] bedi. bhiir 
Tagib: іі: 








| SEA = ade мА 4- Ніһык| = 10 
| БЕЙ = аал | wall s- W valE = 3 


НЕ 4.49 prog: Bt Hm Hox n ЖӘНЕН 


(NB б, ЖИБЕ ИЕ Н RIKI ШЕРИ тол 来 进行 的 写 。 ЕНЕ, ШЕЕ. 
ТЕ ЖЕНЕ IB. 


ИШ 4.50 ЕРІНІН, ЕЕН fish FB katiymi. ізінен, пай, 
程序 prog3 中 的 暂停 。 ЖЕШ S qh, НЕННЕШЕН, {ЕКЕШН НИП E Б {ЕШ edy 
Aahir, RAUF ФЯТЕЧЕНІП E EHE EN ter Kitir s. ТЕ КОҢ BE S 
写真 正 发 生 ， 面 是 用 写 回 阶段 中 的 值 (信和 号 W_valE) 作为 操作 数 valA， 用 访 存 防 段 中 的 值 【信号 
M_valE) fEÀXHBEIEE valB. 

Ж T ЯНЕ Ni Ж. BRE ПАН ИЛИН ЖЕНЕ Hur HEBES НЕРІН, DL ate 
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程序 prog4 所 需要 的 暂停 ， 如 图 二 引 An. NN A h, ИШЕ B EM KMA WI hf EHE 
жей 未 进行 的 写 ， 而 且 热 行 阶段 中 ALU 1E VETERE] (ÉL h ЕЗ A А сах, ТЕГШ UY E 
АЕ t (T SE M. УШЕМЕЛЕНЕН хал, 也 可 以 将 ALU 的 输出 ! 情 号 e. valE) f: JU Wk TEB valB. 
ЕВ. EB ALU f/f ЯНЕ ҤЕ НЕН. WEITER RS EH PIN a ko HU ETN D valA 
HI valB, ЕРЕЕН EJE E — PREMIUM, ЖЖ rE E ie kampa. mt 
此 之 前 ALU 的 输出 已 经 是 言 法 的 了 ， 

Н priog? 1 

Пя400: irmogvl $17, bedx 

üx$]&; ipmowl £3, Мак 

mie: тар 

Daid: midl Wadx, teaz 


FEISE: halt 





W ӘНЕ = veax 
М ШЕ = 10 


Н|іеіз| 4- 10 













val *— W vaE = 10 
valB 4— M valE = 3 


8450 prog3 ЕЕ S OK EE ТЕАТ 
ic MIB зір, НИНЕ СТЕ РЕТ R d rp Bed ЕНІН. CLR EU TB 24 ТЕ гах IE TEILT. 
EMEN. ded RE ERE HERE UN. PEE ушА 和 val. OW. 

РҮН prog2 — prog4 th iE ЧЕ Xe Ro m Н ЕЙ ALU ЕШШ ЖЕҢ НУО E ТИШ 
ТЕН, NEM [le ЖАТ ЕНШ АЕН HL M 的 值 。 从 访 存 阶 和 有 ， 我 们 可 以 转 
ЕНІН Ж ЙЕ И РЕНИШ 信号 т_уаїМ!. MSANE. FRETI ELEME] M 未 进行 的 
HORT W_valM). АН HR ER TF ds 5] ES Cc valE.m valM.M valE. W valM 和 W valE), 
El K Me Ач] ЖЕНЕ (хад 和 valB?. 

ЇН 4,49-- [83 4.51 ffr i Pope UH E ini йз R 3 H| ЖП W y WW ТІРІНІҢ, ИЕНЕН 
Жіп. Sw bawa ЕЕН ЖН Ж НЕ 四， 逻辑 会 将 这 些 ID 553896472 ID 
srcA 和 seB HER. ІЕЖАНЕНЖЕКАЫ. ПТЕҢЕЗНЕНҢ ID 5-40 D#2. ш 
ЧАРЫШ. RITE SW kW РИ ЕИ ЖШ E. IE JPPOEWEW/ESTH. В 
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ПЕР Е, 
8 progi 1 2 э 4 5 Б ? B 
üxDOD: ігткігі 510, tedy | | 
UxoDE:; irmovl ЁЗ Фая 
üxOüs: add] iedx,Yeax 
ÜwODB: Bale 


е уаіЕ 0+3=3 | 


аА = ебх | valA + M мм = 10 





НЕ 4.51 роса Eb RP REGE {КЕНТ 
fERIBI h. MEHBERHENESIE TT A OH Ron Beda ЖЕНЕ. ЖИЕ ЕКА ТЕЕ ТРИ 8 ZEB. 的 新 
A. үні, A AM AEBCE PECIA. PO ad ARI val AL. 


图 452 ЕНЕ PIPE 的 抽象 结构， 它 是 PPE-T IR. БЕНЕН КЕНЕНІ. sinu 
fi £n T MC T 3 KN LA GER ИЕ К ЕЖЕ (HS KE ж). ШЕФ ЩИ} | bypass 
path) БИЙ ЕЕН Н 53928. "Forward" |, ij de FI ЖИЕ НЕЕ E 
EFE (f PE ДЕЕ val НІ valB. 

ІН 4.53 ErIH T PIPE 硬件 结 村 的 一 个 更 为 详细 的 说 明 。 特 这 幅 图 与 PIPE- LEER] ¿E| 441) H 
比 ， 我 们 可 以 看 到 来 自 五 沾 转 发 源 的 值 反 司 色 解码 阶段 中 两 让 标号 为 “Sel4Fwd А” ИІ "Fwd B" 的 
起 。 杯 与 为 “SehFwd 和 ”的 块 是 PIPE- 中 标号 为 “Select А” [ОД 556 НЕШ. E f 
КНР М] valA 知已 增加 的 程序 计数 器 慎 vaP, АЕ А ЖШН. ЖҰ 
个 辐 发 过 来 的 值 。 标 导 为 “Fwd B" ЕИ ЕЕЕ val B ШЕЕ. 


457 MEER (loadiuse) 数据 冒险 

| Н S S ӨЛЕ APH ЖИ. EDS ERE ERG Wo E BUG T АЕ ЕШ. W asa 
"EPIRI The tk E kr Cload/use hazard), 91 5 С ТІНІН Ox018 的 mrmovl) Mr 
йен ТОН анта сақ 的 值 ， 而 下 一 条 指令 【位 于 地 址 0x0le 的 add PEE e EU EA ERE. 
PH FERAN ТЕГ. add НӘНЕНІН7 中 需要 该 寄存 中 的 值 ， 但 是 mmol #2 
PLUME SFERE. YTA mmol "HRR" addi, FEROESUT TOR (GE GL BEST Е 0 
时 间 ! АЖЕ Л ПЕ]. RÁTISSUEB HA Е OEROEGCIS EE ID. HR, ортан 





i 54% _ 


0x00 [f] бис ФЕ f] Fr ево 的 值 ,可 以 从 访 存 阶段 转发 到 周期 ?处 于 解码 阶 委 中 的 adl 
di. 
W scode, W тайм W ww, W vall, W дә W dali 





Ж 4.52 SB КИЧЕН Е PIPE $$ m 
Bini ARR MARKERT НЫН ЖИЙИ S Ж#Н. т ТЯ 
ңа RH. 


如 图 455 ERARE, ANTURA ЕНЕ Ж. Ж ШЕШШ ЕШ ИШ. У 
mrmovl f i83] GT Re BERE. ЖАРИ ЖШШЕ РЕФ (аш) ЖЕНД U Ж! 


лакан 285 


m === = Бы = —— mam. саш ë ишш ЕЕ 4 


tikl 一 -一 | - | š 
w Ја] |ә | әм [ ss ^ 


m М 







| | = | 


| іі scA ld 








in a } L 
| 


шш ш иш ш шсш N-EN-NCNZ m ши masm шш m m шш шш + CE m. n " в 


Ziff 





Б w | Ty 


图 453 ПИЕНО ЕЕВС Е —РІРЕ dab er EA 
ДЕ o m'ha 


286 | Fat 
GERE. ESHAAN THR STEB—TAO, FAATERE А — Е, ШШ 8 W; 
17 КБ. ААТА Hn n T ELA Ur ERE НЕ RRR ВЕ addl Ph. W ДЕЕ сах 
ИЙНИ ЕД АА, Sj ШЕ RSF. 就 像 流 术 线 图 中 ,从 周期 7 中 标号 为 "D" 的 方 柜 到 周期 8 
{14 "E" ATENE LARNER W 020048 Т ЕЖЕ F koa REIR АЖЕ 
的 addl 指令。 

% progi 1 4 3 4 Б Яя F а 0 10 11 


Dede | тшш] Wecx, Dibedal 





Пал: irer] 912 Feta 
битін. pepr] 01а, айк ë Load kasq 
Dalla: midi Бак, шыш B ras Чен 


Пий: halt 


图 454 ПЕЛЕНЕНШШЕШІТІН 
аш Rr E PEUT LEE Er S EN АЕ cav 的 值 。 前面 的 maasl ІНІМЕ НЫ ЖҮК Ж®сах ІНІН, М 
ЕСІНЕ ЖЕН T. 
АЕ ЖАНАЛЕ ЕН] N ki p ЕЕ (load interlock). JE Tp E AO 8e boe s 
ЖЕШНЕН n ik АИСТ ЕНЕ ЖИНИ SRM. БІПЛ ЖЕН 
LERE ТВРД — З ВЕН ВЕНЕ. 


45.8 PIPE 107893 

现在 我 们 已 经 创建 了 PIPE (BUR 0 ЕНЕ О ЖЕНЕ vae 处 理 器 ) ШИ ЖЕНЫ. E 
全 用 了 一 握 与 前 面 师 序 设计 相同 的 看 忻 单 元 , 另外 增加 了 ЧЕ ЖК ЖИ. ЖЕЕ ІЛ 
ыла жалынан. Ekt., RERNA qo gH. AAE ME И 
КИНИНИ. ТРЕ SEQ A SEQ p WS A eH, ЕІТІЕІПЕНАЕНХИЙЯЖН 
"ra CHOC КЕ ЖҮ ЖЕЕ ЧЕЛ ШЕНЕТИВЕНН {用 小 写 的 阶段 书 字 的 第 一 
ГНЕ Лр ГАВА 的 信号 中 选择 适当 的 值 ， 

作为 一 个 示例 ， 比 较 一 下 SEQ 中 产生 sea HEEL] HCL (0835 FIPE 中 相应 的 代码 : 


# Code from SEQ 


E BE S E E od 287 


ІЛЕ ЯГСА = | 
icode іп | IRRMOVL, IRMMOVL, IOPL, IPUSHL ) : га: 
icode їп { IPOPL, IRET | : RESP: 
Ë : RNONE; # Don't need register 


E 
& Code from PIPE 
int new E srcA = | 
D ісоде in í IRRMOVL, IRMMOVL, ТОРІ, IPUSHL ] : D ға) 
D iecnóde іп [ IPOPL, IRET | : RESP: 
1 : RHONE; # Don't need register 


8 prua" i фа а а 8 T B а 1а 8 %? 
TEGID: ігесуі $125. adm Е 
JEE: [шын] $I kawa 

Tic. mmn] beru, ñ |а 


008021 Lrwwgl ШФІЕ kebe 






20119: mear] бійжікі Chaqu Ë Laad (aux 
bukla 

Гх114: кш taba, tima F Cima sagu 

WI Баје 


тма +— МЇ12В] = 3 


мый *—W ӘНЕ = 10 
ма = m кай = 21 


图 455 ШЕЖЕ ТЕШИ EFI RE 
Жі addi {ЕНИ Б ЛАИН, Желін БШ А РЕ ВВ 0 mrmovl ii pR 32 ®! ЕН кш 15. 
ETE SLE AER T PIPE fi IM E T W “п”, CANA S Rok АЯЖАН D. 3 
TEATE. ШЕ И ЖН ЖЕ; SEQ iim EU ЖРТ TERRA НСІ. 代码 ， 不 过 作为 
ЕЖ. ШАЙ АА 节 中 列 出 了 PIPE 的 完整 HCL (С. 
PC Ж ИШДИ 
ІН 4.56 提供 了 PIPE КИЕВ ibn deb. ШИШИ ЖИ. АНЕ 





28800 жа 


НЕНІ ЯН, ШАШ К< PC di. HT U ERE ТЕЛЕ HHR 4 lai ФЕ 
Wil A i SEQ 中 考 包 的 那些 一 样 (大 见 4.3.4 Tp e B. 

PC 选择 未 辑 从 三 个 程序 计数 器 天 中 进行 选择 。 当 一 条 开 制 错误 的 分 支 进 入 访 存 阶段 时 , АЙ 
求 厂 寄存 器 ML“ 信号 M_valA) ЕНЕ valP 的 值 【 指 明 下 一 条 指针 的 地 址 1。 当 ren 指 地 进 和 
НІНЕН, ж ӘК Ж W 【信号 W_valM) 中 访 出 返回 她 址 ， 其 他 情况 合 使 用 存放 在 流水 
SW AFE F rh Cfr F_oredPCY 的 PC ЧН. 


int Ё ре = | 
F Мізргедісесі branch. Fetch at incremented РС 
М icode == IJXX && ІМ Bch í M valaA; 
? Compietion of RET instructici. 
Нн icodé == ІНЕТ : Ww valM: 
f Default: Use predicted value of РС 


| : Е_ргейрс; 


M inde 
M ТЕН 
| M sni 
ILES 
W uM 





bofan та | e | vac | | wee | — 





Е 455 PIPER] PC HEAR ЕТЕ M 
C ИШЕМ ИНН. ЕНЕЛЕНЕК- FS bir, 


= IH EE E er CUN РН ЖИЕНІН, PC 预测 还 辑 会 选择 уй, oA Е Н val P; 


int new F predPC = | 
f .icode in [ IJXX, ICALL |: £.valC; 
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1 i É valP; 

l; 

标号 为 “Inatr valid". “Need regids" 81 "Need ма" НАН SEQ 967 РЕ. НІН 
ойт. 

解码 和 写 回 阶段 

PH 4.57 Si 07: PIPE 的 解码 和 写 回 填 辑 的 详细 说 明 , 标号 为 "dE ."dsM", "srA" 和 "smwB” 
ЧААК ЖЫР ЕЕ SEQ HERE PHARA. RW W B. HUE ИП ID X BF 
写 癌 阶段 (AE WdE 和 WW_ 屿 tM}， 而 不 是 来 自 于 解码 阶段 。 这 基因 为 我 们 希望 进 行 写 的 目的 寡 
存 器 是 由 写 回 阶段 中 的 指 考 措 定 的 ， 


RI? 
E AES 





Ш 45) РІРЕ 的 解码 和 写 回 阶 段 未 辑 
WT ЕЛ «Р ы ЖЖ НЕЛЕП А РЕНИ, Wë ЕШШ ЕИ ЖЯ. ИЩИ uf d ИЧ a H3 3 
“Бей A" ffi EE Rir. POLRES vala [ИЕ EE, sS “Fad B" КИЕТ ИНЕ walB НЕЯ. 
帝 存 器 写 的 位 置 是 由 来 自 写 回 阶段 的 (мА 和 ып 信号 指定 的 , fe t Ж И-КЕ Н. Di SUELE E ІНШІ 
КИН. 


290 | Каж 
ЖЕН. uU... u uuu... S 
5 IN 4.23 
HERE PHE "dap" ка Ж п АНЕ Ер REH Е, P4 da 
F. Æ PIPE 的 HCL fik, ESL EE FE new_E_dstE, HE SEQ 信号 daE 的 HCL dii, 
35 Hit ES HEL Ж. (R4 434 РИ ДҮН | 


ЛА ^-BrBEIM РЕ ЖЕЛЕНИН ШЕШН Ж. ИННИ, #95 “Sel#Fwd A" В 
ИНЕШ ЛЕШ. CABRERA vaP 信和 号 合并 到 valA AF. ЖЫЛАН Р СЕ Зр ИЕК 
БЕЛІ, CELE Т НЕЕ УНАН. 

ЕНЕ ҰША 和 valP РЕ ТАЕ, ЖИТ сап ИИН ФК ЕШТЕНЕ 
valP ЇН, ШАН TEE E MGR Ze ar pA N ПІН ШЕН, АРЗА HEIL ESE BM code (5 
写 来 控制 的 ， 当 信和 号 Diode 与 call i£ jXX НГЕН АСВ, ik АЕ D valP fE E 
的 输出 。 

Ш458 Oh ҖЕ. ЕТЕ, ыы. PB 0 —+ НІНІ ID. 







| ALU Mi 
ГІТ! 
ШИШ рй Eam 
ЧАВ м Ж Кїї 
W.vuk WoduE | ЧЕН мап E Xil! ín 


如 果 不 满足 任何 转发 条 件 . АКА ЕЗЕР d rvalA "на А 中 旋 出 的 值 3 作为 它 
的 输出 ， 
BEERS, NEA FIER HKE Е 的 valA 的 新 值 的 HCL 描述 
ІНЕ new E valA = | 
D icoóde in | ICALL, IJXX } ; D valf; # Use incremented РС 
d srcA == E dBEE : e valE; 4 Forward valE fram execute 
d srcA == M dstM : m valM; 4 Forward valM from memory 
d &rcAÀ ss M, datE : M valE: 6 Forward үзік from memory 
d 5ГСА == W dstM : W valM; 4 Forward valM from write hack 
d FrCÀ zz W dstE : И valE; 4 Forward valf from write hack 
l та rva.A; # Use value read from register file 











l: 

Li HCL {КРЕ pik h янтар жен, ШКЕ ЖН HCL финн 
EI ERWA D ШЕЕ. ШИЖ T ILE NUR, йуу, WER ER zz ШЙ. 
Ш 4.58 ЖИН TARRA ЕШ ЖАНА RU US ED ЕН КИЕ И LE QI a HR 在 这 个 程序 
H. 前 两 条 指 才 写 寄存 器 和 edx， 而 第 三 条 指 坟 用 这 个 寄存 器 作为 它 的 源 操作 数 。 当 指 专 mmovl # 
期 4 到达 解码 阶段 时 ， 本 发球 辑 恬 肛 在 两 个 都 以 证 亚 寄 存 器 为 目的 的 值 中 选择 一 个 。 а 
КЕТ 为 了 设 定 优先 组， 我们 必须 考虑 当 一 次 执行 一 条 指 地 时 ， 机 器 语言 程序 的 行为， 第 一 条 
irmov] Hi РАР dr Бей BE 10, 58 — Жата fü 5532 3. ЖЕ mov] 365-2 3А 
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PRH 3. ЦТ З, ЭПИ ЕЕЕ А E e TR ЖИІ РІНЕН 
ШИШИ. [ШАГ BER ЖЕ РЕ РЕЗА hi ИЧКИ ТИТИ ІНІН. 因此， 上 述 НСІ. firi ie 
EA E X rH ER ЕРЕН ЯН, ЖЕНІШІНІЕНДІП, ЖЕЯ ЖЕНЕШЕ РВ. 
81 FLEVIT RUSSIE RE АКРА Ж 0956 ЖЕН, FUHR рор! Февр 有 影响 ， 因 为 具有 
ЕНИ ӨН, 
ü prog 
üxünd: істеті 512, нік 
00006: Іт] 53. kada 
Оя00с1 rrrov] Teik., еви 


Пяййй: halt 





Н 4.55 MEDIE RR 
ал Тл Т s UT EL ДЕВА АЈ WR PHI Ki ТЕДІ EDERREN 
ЗЕ ET dp Ae B RH, 


练习 是 4.24 E T n E o0 nac На. 
2 Ж new E уш 的 HCL RAH ETET pe “ë WA XR 
过 束 的 ， 请 描 过 下列 程 序 中 movi 84 (X S 440 ФАН: 

| ігтоу1 55, tedy 

2 irmov] SDx100,%esp 

3 rmmowl Жейх, 0 (Wesni|i 

4 popl *esp 

5 rrmovl teap, ћеах 


З 4.25 ` 

FL new. Е valA 的 HCL КАФЕ ЗЬ НА (k B S R ALA) 的 顺 库 是 
анфи. эша НЕН Үз. EE HUE А, LEAN 
"й. 
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ЕЛЕ 426 

ЖЕР АЖА А ЕНІНЕН valB ЕНІ. БЕУ new E valB 的 HCL 150, 

H i rB Ph 

Il 4,59 ЕАД PIPE TE ИНЕ. ЕНЕР НЕНІҢ SEQ БН. {Дд 
ий а ө. BITES SS е valE HI E dstE E Od. НЕШЕ. 


es Jen | we | w | Jeep | 





| = p =E 
boond mel E gir 








Ба we | эя | же [ases [cn] ce: 


4.57 PIPE 的 执行 阶段 还 辑 
ІНЕН SEQ EB ЕНЕНЕ ЖН. 

ШГАР} 

图 4.60 set iE e PIPE ОТТИН. dix 4p SEQ ІМІЛІГІГЕ (Мал НЫ, W 
ПІН, ШИИДЕ ДЕР. PIPE 中 没有 SEQ this “Data” fik. ЖАМАН ЖҮРЕ 
valP (对 call {УЖ ЖЯ valA PHETT. {НДА ЕДЕН E k HM ТМД "SeleFwd 
AMHER iy). m HEHBrpim RK dh Hš SEQ PHG RAAR, pr АЙЧ ШЕ НК RS. 
(EXE P, ТЫ НЕН ЖЕГІ ТИН. МЕМ 和 W KE yo Rok Е 
І-ҺҢШ ЕНЕ Kab o. 


459 Ж ЖЖ ШИЕ 

HEU E ЕШ КОК ВЫШ tim, TEE] PIPE Dit Г. APEND AAE F= 
БИШНЕ. ПЕН Cjn iy Kuy ЕНЩ) 和 不 足以 性 一 的 惊 制 情 况 ， 

Әнге: 流 本 线 必 菇 暂停 直 到 met КФ ИШЕ НЕН. 

КӨЖЕ. dc PEEL CP UI HR Re UTE RULES m [e]. ЖЖЖ 
wy T МИШ. 

MARARA: Л ЖЖ ОҢ АКУУ. ЗҮНРІНЫЛ ЫН Ie АЖ 
HT. Da A ok REIS. 

ІЛЕСЕДІ БЕЛІНЕ ЛЕТ HH AER ЕНА И ОРУ ЫҢ, 
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AM uw 
* M oE 


图 4 如 PIPE 的 访 存 阶段 还 加 
КЕЖЕ M R W Е Т а ТТ Я 
t rich qp t i8 B IO ач. 


WT ret fib, ЖЕГЕШ тала ытта АВА АЕО, АЕА He MAE, 
以 供 参考 


ШЖШ 1 істеуі Stacx,Wesp f Intialize stack pointer 
00l: calli proc й Pracedure call 


üxÜüb: |pemovl S1D,tedx 
ÜxÜüll: halt 
Пх020: „ров йх20 


Return point 


x02: proc: 
# П "Ir FEL i progi 
0х021: rrmovl Фейх, жерх % Hot executed 


0х030: „ров 0х30 

0х010: Stack; k Stack; Stack painter 

Қала ТАП СРЕ ОА ЖЕН ret f. Fb BER GLK ERE В, IDEE GT T i 
AH, WARATA SA nie. БШ EIE. {Н-НИН ЕЕЕ НІ ІНІН 
НАН, 18 ДЕЧ AE TB A — ER. НПФЛЯИИННЖНАНШ. ІНЕН 
ЕЕ ИШЕНЕР НҮ W. 

ШІН 4.61 Bras, ЖЗ 中 取出 il Bi. ЖЖЖИ. EUR 7 АНЫН. іске 
Шап. AITAB, ЖЖ ЕЕН НИ Ө. ЭИПЛИНЕИЖЕФЫА- ЧН. 

“Н. ге! dri PURA (АРЕ, РСЕЯЕРНИВНЕИІНЕЕІ is EE MGE. ЖЕҢИШ Н НН 
{РН СОҢ ОЬ Э 处 的 inmevl f. 

ІН 4,62 ЖИНДЕР, ret ЗНА КУЗ leta. ERTER, ҮНМЕН 
ЕЕЕ TRA PON. ӘРИ, ЮЕШ АА И IEEE PE Н. £T ask IER 
PC КӘНЕ HCL fim. 我 们 可 以 看 到 ， 对 ech kin, РСІНІНІШЕНІШІНІ valP 的 ， 也 就 是 下 

条 指 他 的 地 址 。 在 我 们 的 示例 程序 中 ， 会 是 OxO21. HU ret ЕТ rrmovl НІ, ЕРІМ 


294 TẸ; 


Wik. AAMER ШИ AHR Жар, «irum. BEERTA WER 
ШЕННЕН. WRR ESA ТРЕ mmol S5, {Н ЖЕНИШКЕ W 
ERRTU IR THERE 462 ЖАТ. <A F “(Ga Е 
EA КНР. ЖІП, ШІНТ ШІН ітюу 指令 。 ER 462 HIPH 461. TEUR, ЖІПІМУ: 
现 达 到 了 了 期望 的 雍 果 ， 内 不 过 连 奈 三 个 周期 职 出 了 不 正确 的 指 才 。 

prag? 1 z 2 | ^ É T Б 4 10 11 


Пап іттету1 Btack, фейк 





üxDüb: call prac 
üxDzÜ; Tes 
bhuhbla 


bubbi s 







huhhb ze 


Oxüüb: іскігі $10, badr # Return point 


图 46! ret Е ВД 
Wem ШИЕ ЖИГ ЕНИН. ЖАҢАНЫ. ЕНТ А Z UM, A rei RR SSES (WIB Т). 
PC ЖЕН НИ ЕВЕ НЧЕ LIE EE 
E prog? 1 š » Ed b Ẹ 7 В 8 10 11 
DxüDD; ireny] Sterk. Wed 
ÜxüDÉ: call ресе 
йийёй: rer 
0Х021: тгиеті Wedw, Veba 8 Mor axecurad 
bubbla 
0ж%21: rrmerwl ada, taba F Mot srecuted 
bubble 
Скі2із ттт Wedx,keox й Mor sxucuraüd 
bubble 


Gxtdb: ігесті $10, bedr # Return point 


Н 4.52 ref 指 党 处理 的 实际 处 理 过 得 
TERRE ER ы МДЕ ren 指 地 后 面 的 птен Jf, ПОЗ ЖЕНЕШЕ IN EE DPA PLC. КН mmo] РАНЕЕ Е E. 
HR RIP IM ЖЭ БВ 341 Sor) Wi. 


(E 4.5.7 (ПР, Sif pee T naui RITE С losdfuse hazard) Fr W td СВЕТЕ, ШІН 4.55 
所 示 ， 内 有 mmo 和 pop 指 专 会 具 存 储 器 中 读数 据 ， 当 这 两 条 指 专 中 的 一 条 处 于 执行 阶段 ， 而 震 
想 若 目的 宵 在 状 的 指 付 正 椒 在 解码 阶段 时 ， 虑 们 要 煌 第 二 条 指 叙 阴 塞 在 解 大 阶段 ， 并 在 下 一 个 周期 
入 执行 阶段 中 捅 入 一 个 气 潭 。 此 局， 转发 这 四 人 鲍 解决 这 个 数据 置 险 , п ЕИ КЕ ЖШ D B 
PARTERS., MAAAR RETRE. SERAH. ДЕЕ ЕКЕНІНЕ 
Wd. АҢ-Ж. 4x3 UU KINH Е 33 2, ИЛ. ЖНЕТИЯНИЛЖЕЗНЕЖН hazard 
condition), {КЖ ЕА п Iqu TE, H HA karir hias X tN. 


ILLIS I" 
^ ТИНИ Ms iE o Fl ECRAN ed e hf 
it, DA. 


ÜxÜllü; могі €*eax, tagay 


Ox: jne target # Mot taken 
Dx : irmovl 51, Weax й Fall through 


Ож ка: ^ halt 
Пхйре: target: 


üxüDe : irmovl 52, Wedx 8 Target 
йж] 4: irmovl 53, %ebx й Target+]1 


Ож0іа: halt 


ІН 4.63 AH Rn Ap S CS dE 5. FIIIT ARRETA АПИ h, 
ydg КГКП НЕН ПО. ААКНЫН S RIPE E. BLUE З Р elk hi TE 
转 目标 处 的 指 对 ， 而 周期 БЕНЕН W iah. ЕН 4. DEERE EHAE) 
莹 之 表 ， 己 痉 取 出 了 两 条 指令 ， 不 谋 读 崔 妹 热 行 下 寺 了 。 幸 运 的 是 ， 这 两 条 指令 都 没有 导致 理 序 员 
nf Rid ЕЕЕ, НИНВЕФОНИЯНПИПЕИНЛЕЖ ЛИНИЯ, VENUE UD. ФЕН 
内 性 色 。 我 们 内 看 在 下 一 个 周期 往 解 码 和 执行 阶段 中 插入 气泡 ， 间 同时 取出 跳 转 指令 局面 的 指 专 ， 
这 本 就 能 取消 一 一 有 时 也 称 为 指 叙 排除 Laashing》 一 一 屠 丙 条 预测 情 误 的 指令 。 这 样 一 京 ， 两 条 
Fir IS EHE e rs ilo eg mif 

Ë progt 1 1 1 4 5 ë 7 ñ (€ w 

Dx0O3: zorl bexx, enx w 

UNII: ing target Д Қос каап 

üxGDa: irori $2, beds È Target 
hubhla 






ПяП14: irmcvl 51,ішізх # Target*I 
ББ 

бж007: irmovl 52,%еіх # Fail througü 

xidi hait 


E40 GRAAN 

лл ТЕРЕГІ ЖІ а ER, СЕНЕ T A, ИҢ. ТІ; 
AMRAH. VENIR S 1, СНЕ САТР А ЧАН. ET RUE He es ТИННИН ЕА. 

A RO PW e IT 

图 4.64 puis ТЕМА ЕНІНЕН. ЛІНІП НСІ. deuote T ЕНШЕ IET A HL 
i ВРТИ Б, -ҺңЕШЕРІНЕІРШЫІЗЕІ Tx eeu K. D FER ЕЛИНЕ F АДЕН 
SiL ELA fr A, DEL ARS CERTI IR NAR К n dint HR. #&—1 РИЧ. ЖАН 
ЖЕН D. ЕМ РЕГЕ И О, funr uir air erp ИН Ard. f pU per A NEG Ft 
信号 d srcA 和 二 arcB zzi И Spr Р p SW k EHE ID. ` res h Ж kan 
H MURUS. АШ РНЕ. AIRWEB HE ИНЕ ER. HEREIN FEE k g НТ 
阶段 中 的 指令 甘于 (mrmovl E pop). ЧЕНЕ SE FLESH dr iti. 
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AABUETE РОМЕН, ЖЕН НА ЕЛЕДА ЖЩ МНА. DUREE PIE rr ER 


时 ， 它 束 能 设置 从 错误 预测 中 恢复 所 需要 移 条 件 。 当 跳 转 指令 处 于 执行 阶段 对， 信号 e Већ 指明 是 
TEE. 


处 型 ret IRET € {0 icode, Е. icode, M_icode) 


Ins HI E e E icode € [f;IMRMOVL,IPOPL] &&E, dstM € [d srcA,d. srcB) 
HR v әры xx E icode = [XX && ! Beh 





图 4.64 КАЗ ЕА 
= [КЁ A ЕЧ КЩ, EA MS RIP, VS pu kati, 

流水 线 控制 柑 制 

图 4.65 给 出 的 必 МЕНЫН, 它们 使 得 流水 线 控制 逻 辑 能 将 指令 阻塞 在 流水 线 寄 丰 器 中 ,或 
是 往 流 水 线 中 插入 个 气泡 。 这 些 机 制 包 括 对 425 WH ЖЖЖИ ИШГЕ. Бы 
АУЕ А АРТ AERE PA ТЫШ А: 暂停 (май) MAH Cbubble》}。 这 些 信 号 的 访 置 决定 了 当时 钟 上 
升 时 该 如 何 蝎 新 流水 线 寄存 戏 。 在 正常 换 作 下 【情况 A}， 这 两 个 输入 都 设 为 0， 司 得 害 存 器 如 载 它 
有 的 输入 作为 新 的 状态 。 当 暂停 信号 设 为 1 时 情况 B)， 禁 小 更 新 状态 。 相 反 ， 寄 存 器 会 保持 它 以 前 
的 状态 。 这 使 得 它 吕 以 将 指令 阳 塞 在 某 个 流水 线 阶段 中 。 当 气泡 信号 设 图 为 1 时 (情况 CY， 寄存 内 
状态 会 设置 成 果 个 固定 的 复位 配置 (reset configuration)， 得 到 一 个 等 就 十 nop 指令 的 状态 。 一 个 流 
水 线 寄 存 器 的 复位 配置 的 0、1 模式 是 由 流水 线 寄存 器 中 字段 的 集合 决定 的 。 ИШ, ЖЕЙТ 
A D PHA 1, RIRH icode 字段 设置 为 常数 值 INOP (图 424), ЕЯЛЖВЯЛЕЕ ЕЛІ 
WA AAW RIEK icode 字段 设 为 INOP, 并 将 dstE_dstM.srcA 和 sreB 字段 没 为 常数 RNONE。 
确定 复位 配 交 是 硬件 设计 师 在 设计 流水 线 寄存 器 时 的 任务 之 一 ， 在 此 我 们 不 会 讨论 细节 。 我 们 会 将 
把 气泡 和 暂停 信号 部 设 为 1 看 成 是 出 错 。 

图 4.66 中 的 表 给 出 了 各 个 流水 线 寄 存 器 在 三 种 特殊 情况 下 应 该 采取 的 行动 . 对 每 种 情况 的 处 理 
部 是 流水 线 寡 存 器 正常 、 辆 停 和 气泡 操作 的 某 个 组 合 . 

在 定时 方面 ， 流 水 线 坷 在 器 的 暂停 和 气泡 控制 信号 是 田 组 合 还 辑 甘 产后 的 。 当 时 钟 上 升 时 ， 这 
蔡 值 必 绵 是 合法 的 ， 使 得 当下 一 个 时 钟 周 期 开始 时 ， 每 个 流水 线 寄存 器 要 么 加 载 ， 时 人 么 暂停 ， 旧 么 
产生 气泡 。 有 了 这 个 对流 水 线 宣 存 器 设计 的 小 扩展 ， 我 们 就 能 用 组 合 还 辑 基本 构建 雇 、 寺 钟 寄存 器 
和 随 抽 访问 存储 器 ， 来 实现 一 个 完 闽 的 流水 线 ， 所 括 所 有 的 控制 。 

控制 条 件 的 弓 合 

到 口 前 为 止 ， 在 我 们 对 特殊 流水 线 控制 条 件 的 讨论 中 ， 我 们 假设 在 性 意 一 个 时 钟 周期 内 ， 最 
多 只 能 出 现 一 个 特殊 情况 。 企 设计 系统 时 ， 一 个 常见 的 毛病 是 不 能 处 钳 问 时 出 现 多 个 特殊 情况 的 
情形 ， 让 我 们 来 分 析 一 下 这 些 可 能 性 。 疼 4.67 画 出 了 导致 特 原 控制 条 件 的 流水 线 状态 。 ЖЕНЕ 
出 的 是 解 色 、 执 行 和 访 存 阶段 的 据 。 暗 色 的 六 框 民 表 要 出 现 这 种 条 件 必 胁 要 满足 的 特别 限制 。 如 
载 /使 用 骨 队 要求 执行 阶段 中 的 指令 将 一 个 值 从 存储 器 读 到 寄存 器 中 ， 同时 解码 阶段 中 的 值 要 以 该 
奇 他 器 作为 源 操作 数 ,预测 错误 的 分 支 要求 执 行 阶段 中 药 指 令 是 - -个 跳 转 指令 。 对 ret 来 说 有 二 种 
可 能 的 情况 一 一 指令 可 以 处 在 解码 、 执行 或 访 存 阶段 。 当 ret 指令 通过 流水 线 时 ， 前 面 的 流水 线 惟 
段 都 是 气泡 。 
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图 中 标明 的 两 对 情况 可 再 同时 出 现 ， 
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УЕП! ФИЙ ТАЯ, ХР ЖЕН ЖЕН. ЖШ. A A TRA ДИЛЕ REX 
НАННАН MA-PE RATE HEMSE S (mrmovl 或 рор), т — T E KK E 
RRES. ЖШ. BAAR ге: ЫН BJ ЙЕ j ДЕНЕ Ee x Po E АР 231818 
HHP. Ау HR ka HHJ B hh ЕР TRE LE HIC. 

组 合 A 是 指 执行 阶段 由 有 一 条 不 选择 分 支 的 跳 转 指令 ， 而 解码 阶段 中 有 -4% ret 指令 。 出 现 这 
种 组 人 台 竖 求 ret 伺 于 不 选择 分 文 的 日 标 凶 。 诉 水 线 控 制 四 各 应 该 发 现 分 文 预 洗 销 误 ， 国 此 要 取消 ret 
指令 ， 


练习 题 4.27 
写 一 个 Y86 汇编 语言 程序 ， 它 能 导 狼 出 更 组 会 态 的 情况 ， 并 判断 控制 妈 辑 是 和 否 外 理 正确 ， 


将 对 组 合 А 条 性 的 控制 动作 合并 起 来 Oa 4.65)， 我 们 得 到 下 和 耐 这 样 的 流水 线 控制 动作 :假设 
"YU BEL TERI di LEE RIAM): 


їй IK ES EAT RR 
THE inti ЕЖ 正常 ЕЕ 


ЖЕ rel 


Fill E VERI) А 
组 合 





EME Bi HORI A 的 处 理 与 预测 错误 的 分 去 相似 ， 只 不 过 在 取 指 阶段 是 暂停 。 幸 过 的 是 
在 让 一 个 周期 ，PC 选择 远 辑 会 选择 路 转 语 面 天 条 指令 的 地 址 , 而 不 是 预测 的 程序 计数 器 慎 ， 所 以 流 
水 线 寄 硅 器 上 友 生 什么 是 没有 关系 的。 因此 我 们 做 出 结论 ， 流 水 线 能 正确 处 理 这 种 组 合 情 况 。 

Hf Bam “个 加 载 /使 用 时 险 ， 其 中 如 载 指令 设置 寡 存 器 和 esp， 然 后 ret 指令 用 这 个 寄 好 器 作 
ЖӨНЕЛТЕ ААА ҚБТ ДАНЫ. ЖЕТЕРІ ret 指令 阻塞 在 解码 阶段 。 


练习 题 4.28 
写 一 个 Y86 汇编 语言 程序 ， 它 能 导致 出 现 组 含 BB 的 情况 ， 并 以 han EAE, Е 
否 处 理 正确 ， 








їй ЛК WE ERE 
и |" э» E Á 


ЖЕТЕ ret 
ЖАЛА ЕПП. 


HAE пу, 


МТА В РЕНАН Ee (图 4.66)， 我 们 得 到 下 面 这 拌 的 流水 线 控 制 动 作 ; 

如 不同 时 触发 两 组 动作 ， 控 制 堵 辑 会 试图 暂停 ret 指令 来 避免 加 载 /使 用 冒险 ， 同 时 又 会 因为 ret 
ll 令 而 往 解 码 阶段 中 插入 一 个 气泡 。 显 然 ， 我 们 不 希望 流水 线 同时 执行 这 陆 组 动作 。 相 反 ， 我 们 六 
望 它 具 米 取 针 对 加 载 /使 用 冒险 的 动作 ， 处 理 ret 指令 的 动作 应 该 推迟 个 周期 。 
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A57 HH RUE B 需要 特约 处 理 。 实 际 上 ， 我 们 PIPE КЕЗЕН ШИЖ ТЕ ЕТПЕ bp 
amc. Misi DEG TU EBENE. EERTE IHE. О АРЕНТ 
才能 发 现 出 来 。 当 执行 一 个 含有 组 音 BB 的 程序 时 , ESUPN CHEROKEE D f^ountrer U 
DRA 1。 这 个 例子 表明 了 系统 他 析 的 重要 性 。 具 运行 正常 的 程序 是 很 难 爱 现 这 个 问题 的 如 果 祝 
有 发 现 革 个 问题 ， 流 水 线 就 不 能 患 实 地 实现 ISA 的 行为 。 

FW ESE ] 

[Н 4.68 fe EIE Ж КЕ Fa S Een d. ЕЕКНИЯЕ КЕНИЯ КЕЕ SDI SE. S 
BPAP EAKR ЖАНЕ КЕЛЕ PERI PCIE. 我 们 可 以 将 图 4.64 的 发现 条 件 和 图 4.66 的 动作 
теж. ЕЛИ ЖКН BR SJ НСІ. fil. 

Ж o {ЖЕ Ere ret S. ЖЖЖ {РЕФ ЕЕ, 

bool F stall = 

# Conditions for a load/usme hazard 

E icode in { INMRMOVL, IPOPL | БЕ 

E dstM іп І d src, d srcB ) |! 

# Stallimg at fetch while ret passes through pipeline 
IRET in ( D icode, E icode* М icode 1; 





ЕН 4.68 PIPE dox eb ЫЕ 
ЕТЕНЕ lito ERR. DLE AE, їр, ENABLE S cn Ind He т. 
1$ JB 4.29 
BE H: PPE ЖЕР ТП stall £j НСІ, 4, 


B SIM MAT ЖИ ret R. AKERE D ШШ ШМ. Ж. ТЕШТИ 
ЕГ, SERI HEC Hi НЕН ret Pe EL riil, ЖУЫМАНН. 
Бос] D bubble = 


300 %4% 


# Mispredicted branch 

(E.icode == 11ХХ && !e Bch) |! 

# Stalling at fetch while ret passes through pipeline 
ІЗЕТ іп { DL icode, E icode, M icode 1; 


练习 题 4.30 
E H: PIPE 实现 中 信号 E_bubble 的 HCL 551, 


现在 我 们 就 讲 完了 所 有 的 特殊 流水 线 控 制 信号 的 什 。 在 PIPE 的 完整 HCL 代码 中 ， 所 有 其 他 的 
流水 线 控制 全 与 都 设 为 0。 


4510 性 能 分 析 

我 们 可 以 看 到 ， 所 有 由 要 流水 线 控制 避 民 进 行 特殊 处 理 的 条 件 ， 于 会 导致 我 们 的 流水 线 不 能 竟 
实现 每 个 时 钟 周期 发 射 一 条 新 指令 的 日 标 。 我 们 可 以 通过 确定 往 流 水 线 中 插入 气泡 的 颊 率 ， 来 衡量 
这 种 效率 的 损失 ， 因 为 搬入 气泡 会 导致 无 用 的 流水 线 周 期 一 条 返回 指令 会 产生 :个 气 汇 ， 一 个 加 
载 /使 用 冒险 会 产生 一 个 ， 宙 -个 预测 错误 的 分 支 会 产生 两 个 。 我 们 可 以 通过 计算 PIPE 执行 -条 指 
令 所 需要 昼 平 均 时 绅 周期 数 的 估计 值 ， 来 量化 这 些 处 到 对 整体 性 能 的 影响 ， 这 种 衡 莉 方法 称 为 〔CPI 
(cycles per instruetion， 每 指令 周期 数 )。 这 种 衡量 值 是 流水 线 平 均 吞 吐 量 的 倒数 ， 不 过 时 间 单 你 古 
HERAS MODERE RER ARI IRAR CR RE A HR A EE 

5 —EHEf CPI КЛУ, BERETES ЛАТ ЕТЕ, PARAIT RAIET. 
SES. AIHERRA ЗК S TH, RERA y stil q КЕЛИ. НЕ, ВА 
处 理 一 个 由 于 三 种 特殊 情况 之 一 而 播 入 的 气泡 ， 如 果 这 个 阶段 一 共处 理 了 С.Ж C, T ІН, 
那么 处 理 器 总 共 顺 要 大 约 CC, THER PES BEST 马 条 指令 。 我 们 说 “大 约 ” 是 因为 我 们 忽略 了 启 
动 蚀 令 通 过 流水 线 的 周期 。 我 们 可 以 用 如 下 方法 来 计算 这 个 基 淮 程 序 的 CP1: 
C; +G, С 


=10+-— 
C; C 


CPI = 

也 就 是 说 ，CPI 等 于 LO F -个 处 罚 项 CyC,， 这 个 项 表明 执行 “条 指令 平均 要 插入 老少 个 气 
泄 。 国 为 内 有 二 种 指令 美 型 会 导 镍 插入 气泡 ， 我 们 可 以 将 这 个 处 入 现 分 解 成 二 个 部 分 ; 

CPI = 1.Ü+Ip+mp + rp 

KH, ір (load penalty, MRA TDO E РААН АЗАТ ЕН Àu EJ тр 
(mispredicted branch penalty, T313] E zp b 10 ШЕЙН BUTS IB МН А РЕК ЫЕ. 
ПП rp (return penalty, WPi EAHA F ret ЕЕ БЕН АТАТЫН. ERNE PAR S: H 
该 种 原因 引起 的 插入 气泡 的 总 数 COLE] RAO. BRAUN. СС), 

内 了 估计 每 种 处 外， 我 们 需 槛 知道 相关 指令 (加载 、 条件 转 称 和 返回 ;的 出 现 频 率 ， 以 及 对 每 
种 指令 特殊 情况 出 现 的 频率 . 对 我 们 ЕРІ 的 计算 ,我 们 司 用 下 面 这 组 频率 【等 同 于 [301 和 [33] 中 报告 
ЗНА э: 

e JE (mrmovl 和 рор!) rPH 8114148 43259. К 206 58 АЕ А. 

. 条 件 分 支 指 令 占 所 有 执行 指令 的 204. Е 6092007, ІП 4ОФ ТЕР Ж. 

. 了 剑 上 指令 占 所 有 执行 指令 的 29. 


AE BA EH Ag __301 





ІШЕ, ТӨР ЕНШЕ, тШ. ЖНА E R5 НЫНАН 
TEE; 





三 种 处 罚 的 总 和 是 OT, MER CP 127. 

我 们 的 目标 是 设计 一 个 时 个 周明 发 射 一 条 指令 的 流水 线 ， 也 就 是 CPI 为 10。 我 们 没有 完 休 达 
到 目标 ， 但 是 整体 性 能 已 径 入 不 错 了 。 MIEREA ЗЕ — ЕЕ CPI, WEAR hi: Е 
揣测 错误 的 分 支 上 。 它 们 占 到 了 整个 处 罚 027 фео 016. В РЕВЕ Е, RTT REN EN 
TERHI. TARARE NENIE RRA. 


5 5] 4.31 
REAME T-A RAET RH 6594 ER K b. ТТЕ getan 
ШН, p 453 WP sup mat. masc Yi АЙЫН ЕТ ШШК нат 


4.5.11 未 完成 的 工作 

我 们 已 经 创建 了 PIPE ХНИК, wu ГЫШ. FERT HEB HUE HUE 
(pipeline flow) 不 是 以 想 理 特 萄 情况 的 流 术 上 厂 控制 园 辑 。 不 过 ，PIFPE ЖЩ —# нн 
设计 中 所 必 直 的 关键 特性 。 我 们 会 强调 其 中 一 些 ， 间 讨论 要 增加 这 些 特 性 需要 此 什 系 。 

Ка. 

ITARA ЕН ЕА ОИН ЕЕ, dn. VERS UE R hp Т үтү 
ИЧИРЕ, ЖЖЖ (exception). ЯН Edo ЕН. 它 调 用 一 个 异常 处 理 程序 Cexception 
handler)， 恋 程序 是 操作 系统 的 一 部 分 。 我 们 会 在 第 8 3h HERE. 执行 hah 指 地 也 会 
WH CUTE. ПЕНЕН PHEHORHEUN 710. AE, КИРОК, PRAS 
BERRE. CAE МЕНЫН. DU SERIE AH UR t RP P Н 
МАК d "ЕЕЕ ЫЙ. 

ЕЕ ЗЕ, BÉ IOS — v. W. ЕБУ 
ж. ИШ. ЕГ ЕНЕРГЕ ННІ, АИ ЕТ Т 
ШУТЕР Boh flo ЕС НА ЫЛ. EL RFHBOUE ИНАН ЕЕ Т SEO SE ДЬ 
BUS IS i ЕЕЕ, ЕКИМЕНАЖН ФИЖРИЯН 3| S ЕЙ. (Uim a. 
Е EN BT, АНЕ UI TER BIET s IR BEER. Ха. ТЕРЕН 
XN АЕА ИНТ КИШ ЖЕН, BCE, 只 应 访问 操作 系统 报告 这 个 异常 。 

第 二 个 细节 问题 是 ， 当 首先 取出 一 条 指 志 ， 开 始 执行 时 ， 导 再 了 一 个 虱 常 ， medi ТІКЕН 
MH. KATHA. FERE “ТАРЕ РЕ II ELE ТН. 

üxüDO: 5300 | xorl &eax, eax 

UxUD2: "74DeDODODO | пе Target # Not taken 
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Üx607: 308001000000 | irmovl 51, *eax # Fall through 


Üx003: 1С | halt 
üxÜüÜe: | Target: 
OxÜDc: ЇЇ | .byte UFF Я Invalid instruction code 


fX MERE. КАА АЕ, БОЕ Р А Хр DxFF 的 字 节 作 为 指令 
《由 汇编 代码 中 ,byte 指示 字 产 生 的 )。 解 码 阶 段 会 因此 发 现 一 个 作法 指令 异常 。 稍 后 ， 流 水 线 会 发 
现 不 应 该 选择 分 支 , 因此 根本 就 不 应 该 取出 位 于 地 址 0x00e 的 指令 ,流水 线 拧 制 逻辑 会 取消 该 指 今 ， 
但 是 我 们 想 昌 避免 出 现 异 常 。 

第 三 个 网 节 问 题 的 产 革 是 因为 流水 线 化 的 处 理 器 会 在 不 同 的 阶段 更 新 系统 状态 的 不 辐 部 分 。 有 
可 能 会 出 现 这 样 的 情况 ， -条 指令 导 敏 了 一 个 异常 ， 它 后 商 的 指令 在 产生 异常 的 指令 完成 过 前 改变 
了 部 分 状态 。 比 如 说 ， 考 虚 下 向 的 代码 序列 ， 其 中 我 们 假设 不 允许 用 让 程序 访问 大 于 0xc0000000 
的 地 址 【 跟 第 ТО 章 中 讨论 的 现在 Linux 中 的 情况 一 样 ); 


1 irmovl 50,%евр # set stack pointer to 0 
2 pushl Феах # Attempts to write to ОХЕ 
j addl %есх,%еах # Sets condition codes 


pushi Jë 9 EC CORRER. AAR ERTER Е ЖЕН] (wrap around) 到 Oxfffffffc. 1241 
阶段 中 会 发 现 这 个 异常 。 在 同一 辕 期 中 ，addl БЕТА ВЕ. eed ЖАНЕ БЕА ТИ. 
这 职 会 递 反 开 角 点 之 后 的 所 有 指令 都 不 能 影响 系统 状态 的 要 求 ， 

一 般 地 , 通过 净 异 常人 处 理 远 辑 合 并 到 流水 线 结 构 中 , ЖЕНЕ M mS ЖЖ РШ IET ERE, 
也 能 够 带 免 出 现 由 于 分 去 预测 错 谋 取出 的 指令 造成 的 异常 。 我 们 给 每 个 流水 线 寄存 器 洪 加 了 -个 特 
AFE sxc， 它 给 出 处 于 该 流水 线 宵 存 器 中 指令 的 异常 状态 ， 如 上 朵 一 条 指令 在 其 处 理 中 于 某 个 阶 
BREET жї, 状态 学 段 就 设置 成 指示 异常 的 种 类 。 异常 状 态 和 其 他 信息 一 起 治 着 流水 线 传 播 ， 
直到 它 到 这 与 回 阶段 。 在 此， 流水 线 控制 逻辑 发 更 出 异常 ， 并 开始 取出 异 囊 处 理 程 序 的 代码 。 

为 了 避免 噶 常 点 之 乒 的 指令 更 新 任何 程序 员 可 见 的 状态 ， 应 该 懂 改 流水 线 控制 轴 辑 ， 使 之 在 访 
上 或 写 回 阶段 中 的 指令 导致 异常 时 , 不 会 更 新 条 件 码 寄存 器 或 是 数据 存储器 ,在 上 而 的 示 齐 程序 中 ， 
控制 逻辑 会 发 现 访 存 阶 段 中 的 push] 导致 了 异常 , 因此 应 该 禁止 add ің НЫ ERE. ОІЖ 
段 文学 所 对 应 的 PIPE 的 模拟 器 中 ， 你 会 看 到 流水 线 化 的 处 理 器 中 处 理 异常 的 技术 实现 。 ) 

让 我 们 来 看 看 这 种 处 理 异常 的 方法 是 怎样 解决 我 们 刚才 提 到 的 并 些 细节 问题 的 。 当 流水 线 中 有 
一 个 或 多 信 阶 段 出 现 异 常 时 ， 信 息 只 是 简单 地 存放 在 流水 线 寄 存 器 钓 异常 状态 字段 中 。 工 常事 件 不 
会 对 流水 续 中 的 指令 流 有 任何 影响 ， 除 了 会 禁止 流水 线 中 后 面 的 指令 更 新 程序 员 可 卸 的 状态 《条 件 
ШЕНЕ А), 直到 异常 指令 到 达 晤 后 的 流水 线 阶 段 ,。 因为 指令 到 达 写 思 阶 段 的 顺 弃 与 它们 在 
非 流 水 线 化 的 处 符 器 中 氛 行 的 顺序 桂 同 ， 所 以 我 们 可 以 保证 第 - -条 遇 到 异常 的 指令 会 第 一 个 引起 控 
制 特 移 到 异常 处 理 姓 序 ， 如 果 取 出 了 菜 条 指令 ， 过 后 又 取消 了 ， 那 么 所 有 关于 这 条 指令 的 异常 状态 
傅 息 也 都 会 被 取消 。 所 有 导致 异常 的 指令 后 面 的 指令 者 不 能 改变 程序 员 可 更 的 状态 。 扒 带 指令 的 量 
种 状态 以 及 所 有 其 他 信息 通过 流水 线 的 简单 原则 是 处 理 异 常 的 简单 后 扣 靠 的 机 制 。 

АСЕК 

Y86 IE RT TIBUH dB NEA Е ЕЕ, ВА Л. ООН ЕО ТИ ~ 
个 出 期 内 处 理 完 。 在 一 个 更 完整 的 指令 集中 ， 我 们 还 需 归 实现 一 些 顺 要 更 为 复杂 操作 的 指令 ， 例 如 ， 
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ЖЖЖ ЕНШЕ, ЦДНА. Е PIPE 这 样 性 能 中 等 的 处 理 器 中 ， 这 些 操作 的 典型 执行 
时 间 从 浮 点 加 法 的 3 或 4 个 周期 到 整 数 除法 的 32 个 周期 为 了 实现 这 些 指 令 , 我 们 既 需 要 额外 的 看 
件 来 执行 这 些 计 算 ， 还 需要 一 种 机 制 来 协调 这 些 指令 的 处 理 与 流水 线 其 他 部 分 之 间 榴 关系 ， 

实现 多 周期 指令 的 一 种 简单 方法 就 是 只 是 简单 地 六 展 执行 阶段 逻辑 的 功能 ， 添 吉 一 些 整数 和 浮 
点 算术 运算 单元 。 一 条 指令 在 执行 阶段 中 逗留 它 所 需要 的 多 个 时 钟 周期 ， 会 导致 取 指 和 解码 阶段 暂 
停 。 这 种 万 法 实现 起 来 很 简单 ， 但 是 得 天 的 性 能 并 不 是 太 好 ， 

可 以 通过 采用 独立 于 主流 水 线 的 特殊 硬件 功能 单元 来 处 理 较为 复杂 的 操作 以 得 到 更 好 的 性 能 。 
通常 ， 有 一 个 功能 单元 来 执行 整数 乘法 和 除法， 还 有 一 个 来 执行 浮 点 操作 。 当 一 条 指令 进入 解码 阶 
段 时 ， 它 可 以 裕 发 射 到 特殊 单元 。 在 这 个 符 跌 单元 执行 该 操作 时 ， 党 水 线 会 继续 处 理 其 他 指令 。 通 
常 ， 浮 点 单元 本 身 也 是 流水 线 化 的 ， 因 此 多 个 操作 可 以 在 主流 水 线 和 各 个 单元 中 并 发 执行 ， 

不 同 单元 的 操作 必须 同步 ， 以 避免 出 错 。 比 如 说 ， 如 果 在 被 不 辣 单元 执行 的 各 个 指令 之 间 有 数 
cM. 控制 逻辑 可 能 需要 暂停 系 统 的 某 个 部 分 , 直到 由 系统 其 他 某 个 部 分 外 理 的 操作 的 结果 完成 。 
宇 帅 使 用 各 种 形式 网 转发 ， 将 结果 从 系统 的 一 个 部 分 尾 递 到 其 他 部 分 ， 和 我 们 前 而 看 到 的 РІРЕ 各 
个 阶段 之 间 的 转发 一 样 。 虽 然 与 PPE 相 比 ， 整 个 设计 变 得 更 为 复杂 ,但 还 是 可 以 使 用 暂停 、 转 发 
以 及 流水 线 控 制 等 同样 的 技术 来 使 整体 行为 与 版 序 的 ISA 模型 相 匹 配 ， 

存储 系统 的 接口 

在 我 们 对 PIPE 的 描 过 中 ， 我 们 假设 取 指 单元 和 数据 存 情 器 都 可 以 在 一 个 时 钟 周 期 内 读 或 是 与 存 
储 器 中 任意 的 位 置 ， 我 们 还 忽略 了 由 自我 覆 改 《self-imoodifgyiog)》 КАА АВЕ А. ЕА 
代码 中 ， 一 条 指令 对 一 个 存 情 区 城 进 行 号 ， 而 后 面 的 指令 又 从 这 个 区 域 中 读 取 。 进 一 步 说 ， 我 们 是 以 
仔 储 跨 位 置 的 虚拟 地 址 来 引用 它们 的 ， 这 就 要 求 在 执行 实际 的 读 或 写 操 作 之 前 ， 要 将 虚拟 地 址 敌 译 成 
ФЕН. ШО, €t -个 时 钟 周期 内 完成 所 有 这 些 处 理 是 不 现实 的 。 更 粮 糕 的 是 ， 正 在 访问 的 存储 
器 的 但 可 能 是 位 于 磁盘 上 的 ， 这 会 需要 上 百 万 个 时 钟 周期 才能 把 数据 读 入 到 处 理 器 存储 器 中 。 

下 如 我 们 将 在 第 6 章 和 第 10 章 中 讲述 的 那样 , 处 理 器 的 存储 系统 是 由 多 种 硬件 存储 路 和 管理 不 
拟 存 储 器 的 操作 系统 软件 共同 组 成 的 。 存 储 系统 被 组 织 成 一 个 层次 结构 ， 较 快 但 是 较 小 的 存储 器 保 
КИГЕН 一 个 子 集 ， 而 较 慢 但 是 较 大 的 存 久 器 作为 它 的 后 备 、 最 靠近 处 理 器 的 一 层 是 高 速 缓存 
存储 器 【cache metmories)， 它 提供 对 最 常 使 用 的 存储 器 位 置 的 快速 访问 。 一 个 典型 的 处 理 器 有 两 个 
串 一 层 筷 速 缓 企 一 一 一 个 用 于 读 指 令 ， 一 个 用 于 读 和 写 数据 ， 另 一 种 类 型 的 高 速 缕 存 存储 器 ， 称 为 
翻 详 后 备 组 神器 (translation look-aside buffer) 或 TLB, 它 提供 了 从 虚拟 地 址 到 物理 地 址 的 快速 翻 详 ， 
将 TLB MAER TETERE, 大 多 数 时 候 , 确实 可 能 在 一 个 时 钟 周 期 内 读 指 令 并 读 或 是 号 数据 。 
因此 ， 对 我 们 的 处 理 器 引用 存 情 器 的 简化 的 看 法 实际 上 是 很 合理 的 。 

虽然 筷 速 缓存 中 保存 有 最 常 引用 的 存储 器 位 置 ， 但 是 还 是 有 时 候 会 出 现 高 速 缓存 不 命中 ， 也 
就 是 有些 引 用 的 位 置 不 在 锅 速 缓存 中 。 最 好 的 情况 中 ， 可 以 从 较 高 层 的 高 速 缓存 或 处 理 器 的 主 存 中 
找到 不 命中 的 数据 ， 这 需 蜂 3- 20 个 时 钟 周期 。 同 时， 流水 线 会 暂停， 将 指令 保持 在 取 指 或 访 存 阶 
段 ， 下 到 高 速 缓存 能 够 执行 读 或 写 操作 。 至 于 我 们 的 流水 线 设计 ， 通 过 湛 加 更 多 的 暂停 条 忻 到 流水 
线 控制 逻辑 ， 训 能 走 现 这 个 动能。 高速 绿 存 不 命中 也 及 随 之 而 来 的 与 流水 线 的 同步 都 完全 是 由 磺 件 
来 好 理 的 ， 这 样 能 使 所 知 的 时 间 尽 可 能 地 缩短 到 很 少数 量 的 时 钟 周期 
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ЗІН, dE ULL ACA У SCIAS E ETATER НА EU. 此 时 , ERSTE ER (page 
faul) 虱 常 信 吉 。 同 其 他 开 笛 一 样 ， 这 个 异常 会 民 致 处 理 器 调用 操作 系统 的 异 篆 处 理 程序 代码 。 然 
后 这 段 代 码 会 扰 起 从 磁盘 刘 主 存 的 传送 操作 ， 一 旦 完成 ， 操 作 系 统 会 返回 到 原来 的 得 序 ， 而 民 致 缺 
奥 的 指令 会 被 重 痢 贡 行 ， 这 次 企 依 占 引 用 将 成 切 ， 虽 然 可 能 会 导致 高 速 缓 存 不 疹 中 。 让 硬件 请 用 操 
作 系 绕 例 各， 然后 它 区 会 将 控制 返回 给 碘 件 ， 这 就 使 得 厂 件 和 系统 软件 在 处 理 缺 页 时 能 协同 工作 ， 
Avr REA m EX BATH PES. 0S 缺 现 中 断 处 理 程序 执行 的 处 理 所 需 的 几 百 个 时 钟 周期 
对 性 能 的 影 喝 可 以 忽略 不 计 。 

从 处 理 辫 的 角度 来 看 ， 将 用 暂 迟 来 处 理 短 时 间 的 高 速 缓存 不 命中 和 用 译 常 处 理 来 处 理 长 时 间 的 
缺 员 结合 起 米 ， 能 够 兢 及 到 丰 储 器 访问 时 由 十 存储 器 层次 结构 引起 的 所 有 不 可 预测 性 。 


Si. 当前 的 徽 处 理 器 设计 

一 个 五 阶段 流水 线 ， 例 如 我 们 已 经 讲 过 的 PIPE 83, RAT 20 世纪 80 年 伐 中 期 的 处 理 器 
证 放水 平 . Berkeley 的 Patterson 研究 组 开发 的 及 TSC 处 理 器 原型 是 第 一 个 SPARC Ж ЕЕН ДИ, Е 
X Sun Microsystems Æ 1987 年 开发 的 ，Stanford 的 Hennessy 的 研究 组 开发 的 处 理 器 由 MIPS 
Technologies ( 一 个 由 Hennessy 成 立 的 公司 ) 在 1986 年 商业 化 了 . 这 两 种 处 理 嚣 都 使 用 的 是 去 阶段 
ЖЖЖ. Inte] 的 1486 处 理 器 用 的 也 是 五 阶段 流水 线 ， 只 不 过 阶段 之 间 的 职责 划分 不 太一 样 ， 它 有 两 
小 解码 阶段 和 一 全 合并 了 的 执行 / 访 存 阶 段 [21]。 

这 上 坚 流 水 线 化 的 设计 的 看 吐 芋 都 限制 在 最 多 一 个 时 钊 周期 一 条 指令 .4.5.10 小 节 中 棋 述 的 CPI 

(每 指令 周期 ) 测 重 值 不 可 能 超过 10, 不 同 的 阶段 一 次 只 能 处 理 一 条 指 邻 ， 较 新 的 处 理 跨 支持 起 
ЖЖ i superscalar) 返 作 ， 意 味 着 它们 通过 并 行 地 取 指 、 解 码 和 执行 多 条 招 人 对， 可 以 实现 小 于 1.0 的 
CPI。 当 起 标量 处 理 器 已 经 广泛 使用 时 ， 性 能 测量 标准 已 经 从 CPI 转化 成 了 它 的 个 数 一 -一 每 周期 要 
行 指令 的 平均 数 ， 即 IEPRC、 对 起 标量 处 理 器 来 说 ，IPC 可 以 大 于 1.0， 最 先进 的 设计 使 用 了 一 种 种 为 
RÆ ( outof-order) 执行 的 技 本 来 并 行 地 执行 多 条 指令 ， 执 行 的 顺序 也 可 能 完全 不 同 于 它们 在 程序 
中 册 现 的 顺序 ， 但 是 保留 了 顺序 ISA 模型 藉 含 的 整体 行为 . 作为 对 程序 优化 的 讨论 的 一 部 分 ， 我 们 
ЖЕЖ 5 章 中 讨论 这 种 形式 的 执行 。 

不 过 , 流水 钱 化 的 处 理 器 并 不 只 有 传 纯 的 用 途 , 现在 出 售 的 大 部 分 处 理 串 都 用 在 嵌入 式 系 统 中 ， 
控制 着 汽 东 运行 、 消 费 产品 ， 以 及 其 他 一 此 系统 用 户 不 能 直接 看 到 处 理 器 的 地 方 ， 在 这 些 应 用 中 ， 
与 性 能 较 高 的 模型 相 比 ， 流 水 线 化 的 处 理 器 的 简章 性， 比如 说 像 我 们 在 本 章 中 讨论 的 这 样 ， 会 降低 
成 本 和 功 耗 需求， 
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我 们 已 经 看 和 到， 指令 集体 系 结构 〔 即 1SA) 企 处 理 器 行为 《就 指令 集合 及 其 编 友 而 放 ) ЯШ 
实现 处 理 器 之 同 提供 了 一 层 抽象 。ISA 提供 了 可 序 执行 的 一 种 顺序 说 明 . 也 就 是 一 条 指令 执行 完了 ， 
下 一 条 指令 才 会 开始 . 

228 1A32 指令 集 ， 并 昌 人 大 简化 其 数据 类 型 、 地 址 模式 和 指令 编码 ， 我 们 定义 出 了 Y86 指令 
ж. HAW ISA BXfr RISC 指令 集 的 属性 ， 也 有 CISC 指令 集 的 属性 。 然 后， 我 们 将 不 同 指令 组 织 


处 理 路 体系 结构 305 


HAR ей Еа, ЖА, ЖЕЛПІНЕ S RB. ТИЕ ЕИ ІНЕ НІ. АШ, 3 
们 构造 了 SEO 处理 器 ， 其 中 每 个 时 钟 周期 推进 一 条 指令 通过 每 个 阶段 。 通过 重新 排列 备 个 有 阶段， 我 
人 创建 了 SEQ+ 没 计 ， 其 中 第 一 个 阶段 选择 程序 计数 器 的 信 ， 它 被 用 来 取出 当前 指令 。 
流水 线 化 通过 让 不 同 的 阶段 并 行 操作 ， 疏 进 了 系统 的 吞吐 量 性 能 。 在 任意 ~- 个 给 定 的 时 刻 ， 多 条 
指令 被 处 理 ， 在 引入 这 种 并 行 性 的 过 程 中 ， 我 们 必须 非常 小 心 ， 以 提供 与 程序 的 顺序 执行 相同 的 用 户 
可 见 的 、 程 序 级 行为 ,我 们 通过 往 SEQ+ 中 添加 流水 钱 寄 存 器 ， 并 革新 安排 周期 炉 创 建 EPE- 济 水 线 ， 
介绍 了 流水 线 化 。 然 后 ,我们 深 加 了 转发 好 辑 ， 加 速 了 将 结果 从 一 条 指令 发 送 到 田 一 条 指令 ， 从 而 提 
高 了 流水 线 的 性 能 。 有 几 种 特殊 情况 需要 额外 的 流水 线 控 制 逻辑 来 暂 人 或 取消 -一 些 流水 线 阶 段 。 
(RED, SYEMIBSXAmEHUWISLTEEBRe. 
е FEE ht W МЯ, КИЙ ЖИЕН ЕНЕ, TE RAE TEERAA. 
ЯТ НЫ, RSS T -AtA RE TU AER, ЖЖЖИ ЕТЕН АНОН S 2S E. 
f pix EA. ЖП. BERE CERE EET HB ӨЗЕН Es n HERE PER z, 
e 我 们 不 党 要 直接 实现 13A。ISA 的 直接 实现 意味 着 - -个 顺序 的 设计 。 为 了 获得 更 高 的 性 能 ， 
我 们 想 运 用 硬件 能 为 以 同时 执行 许多 入 作 ， 这 就 导 笋 要 使 用 流水 线 化 的 设计 。 通 这 仔细 的 
设计 各 分 析 ， 我 们 能 种 处 理 各 种 流水 线 冒 险 ， 因 此 运行 一 个 禄 序 的 整体 效果 ， 间 用 ISA 18 
型 获得 的 效果 完全 - - 致 。 
. 本 件 设计 人 员 必 须 非 常 谨慎 小 安 。 一 口 芯片 被 制造 出 来 ， 就 几乎 不 可 能 改正 在 何 错误 了 。 
一 开始 就 使 设计 正确 是 非常 重要 前 。 意 昌 就 是 ， 仔 绍 地 分 析 各 种 指令 类 型 和 组 合 情 况 ， 甚 
全 二 那些 看 上 去 没有 音义 的 情况 ， 例 站 岂 出 栈 指针 。 必 须 用 系统 的 模 氢 测 试 程序 彻底 地 油 
试 设计 。 在 开发 PIPE 的 控制 逻辑 中 ， 我 们 的 设计 有 个 细微 的 错误 ， 只 有 通过 对 控制 组 合 的 
仔 绍 而 系统 的 分 析 才 能 发 现 。 
4.6.1 Y86 模拟 器 
本 香 的 实验 资料 包括 SEQ、SEQ+ 和 PIPE 处 理 器 的 模拟 器 。 每 个 模 氢 器 都 有 两 个 版 本 ， 
“ GUI 图形 用 户 界 面 ) 版 本 夺 图 形 窗 口中 显示 存储 器 、 程 序 代码 以 及 区 理 器 状态 。 它 提供 了 
一 种 查看 指令 如 何 通 过 处 理 器 的 方便 形式 。 控 制 徊 板 还 允许 你 交互 式 地 重启 动 、 单 步 或 运 
тын, KERERE Та ЖЕЕ Ж Tk ЖЕ. 
° 文本 版 本 运行 的 是 相同 的 模 报 器 ， 但 是 它 只 将 显示 信息 打印 到 终 凋 上 。 对 调试 来 讲 ， 这 个 版 
杰 不 是 很 有 用 ， 人 也 是 它 允 许 处 理 器 的 自动 测试 ， 而 且 它 可 以 运行 在 不 支持 Tel/Tk 的 系统 上 。 
模拟 器 前 控制 逻辑 是 通过 将 逻辑 块 的 HCL 声明 翻译 成 С 代码 产生 的 。 然 后 ， 将 该 代码 编译 并 
与 模拟 代码 的 其 他 部 分 进行 链接 。 同 时 还 有 测试 脚本 ， 它 们 全 面 地 测试 各 种 指令 以 及 各 种 冒险 的 可 
能 性 . 
®ЖУ ПЛАН 
对 十 那些 想 更 多 地 学 习 罗 辑 设 计 的 人 来 洲 ，Katz 的 黑 辑 设计 教科 省 1391 是 标准 的 入 门 教材 ， 它 
ІН RS] ДЕШЕ ГЕМ ИЕ з ЙЕ Н. 
Hennessy ЛІ Patterson [КГ Я Ж WF СЗЗ Е ГЕНОТ r ARS ИЗМ 
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证 这 里 讲 运 的 简单 流水 线 ， 还 有 并 行 执行 渴 多 指令 的 更 高 级 的 处 理 器 。Shriver 和 Smithl691 洋 细 介 
4 Y AMD 制造 的 、Intel 兼容 的 1A32 处 理 器 。 


家 庭 作 业 

432 $ 

在 我 们 的 ҮЛЕН, 例如 图 4.5 中 的 Sum АҚ, ПЕКЕЗІНЕ -个 常数 加 到 寄存 器 
的 情 襄 【例如 ， 第 12 和 33 行 以 及 第 14 8015 17). ЖЖЖЕЯН irmovl 指令 将 МЕНЫН 
为 常数 , 然后 用 add 指令 拒 谤 个 值 加 到 日 的 寄存 器 ,假设 我 们 想 添 加 一 条 新 指令 add, HARU F: 


= Ü : 2 3 4 5 
uve[E v — — 


ХАИН У MAAA IB. Wmughuduux—iseBpWdTMHEER. n UL A irmoyl 和 和 
OPI 的 计算 (图 4.16). 

4.33 $ 

如 3.7.2 小 节 中 讲述 的 那样 , LA32 的 指令 leave п] БАН] Е АНЕ. 它 等 价 于 下 出 这 个 
Y86 指令 序列 ， 


] rrmovl %ebp, *esp Set stack pointer to beginning of frame 
2 рор1 $ebp Restore saved $ebp and set stack ptr to end cf 
caller's Frame 


假设 我 们 要 往 уве ERARE AIR. HR ERU T: 


un 2 1 2 3 l 5 

leave 

请 的 述 实现 这 一 指令 所 执行 的 计算 。 可 以 参考 pop 的 计算 CES 4.182. 
4.34 $$ 


文件 seq-full.hcl 包含 SEQ 的 HCL 质 述 ， 并 将 常数 ADDL 声明 为 EZ HEBES C， 也 就 是 iaddl 
的 指令 代码 。 企 改 实现 задат 指令 的 控制 多 辑 块 的 HCL 描述 ， 就 像 家 庭 作业 4.32 ТЖЕ» nl 
以 傅 考 实验 资料 获得 如 何 为 你 的 解答 生成 模拟 器 以 及 如 何 测试 模拟 器 的 指导 。 

4.35 ФФ 

文件 seq-full.hcl 还 将 常数 ILEAVE 声明 为 十 六 进 制 什 D， 也 就 是 leave ИНЕК, АҚ 
2 REBP 声明 为 7， 即 %cbp 的 寄存 器 ID. ЛЗ leave 18 $ JEE ШЕ НСІ. 描述 ， 就 像 家 
庭 作 业 4.33 PHE ЈАРЕ. 可 以 傅 状 实验 资料 获得 如 何 为 你 的 解答 生成 模拟 器 惧 及 如 何 测试 模拟 器 
的 指导 。 


4,38 %%Ф%% 

假设 我 们 要 创建 一 个 较 低 成 本 的 、 基 于 我 们 为 PIPE- 设 计 的 结构 (图 4.39 和 图 4.41) 的 流水 线 
化 的 处 理 器 ， 没 有 使 用 旁 路 技术 。 这 个 设计 月 暂停 来 处 理 所 有 的 数据 机 关 ， 直 到 产生 所 需 值 的 指令 
己 经 通过 了 写 回 阶段 。 
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X ft pipe-stall.hcl 包含 一 个 对 PIPE 的 HCL КЕНЕН, КТЖ F T REESE, CARE (S 
17 e мајА Же valB 只 是 简单 地 声明 为 下 面 这 样 ， 


Ян DO NOT MODIFY THE FOLLOWING CODE. 


## NO forwarding. vala is either valP or value from register file 
int new E valA = | 
D icode in { ICALL, IJXX } : D valP; £ Use incremented РС 
l: d rvalà; # Use value read from register file 


1; 


ҰЯ No forwarding. valB is value from register file 

int new. E valB = d rvalB; 

惨 让 文件 结尾 处 的 流水 线 控 制 脖 辑 ， 使 之 能 正确 处 理 所 有 可 能 的 控制 和 数据 冒险 。 作 为 设计 工 
作 有 网 一 部 分 ， 爸 还 可 分 析 各 种 控制 情 闹 的 组 合 ， 就 愧 我 们 在 PIPE КОКЕ ЕНЕ СЕЕ 
梓 。 你 会 受 现 有 许多 不 同 的 组 合 ， 因 为 有 更 多 的 情况 需要 流水 线 暂 停 。 要 确保 你 的 控制 逻辑 能 正确 
处 理 每 种 组 合 情 况 。 吕 以 参考 实验 资料 获得 如 何 为 你 的 解答 生成 模拟 器 以 及 如 何 测 试 模拟 器 的 指导 。 

4,37 Фф 

ХЕ pipe-full.hcl & & — ft PIPE 的 HCL ЕЖ, 以 及 常数 秆 ADDL 的 声明 。 修改 该 文件 以 实现 
指令 iadd, WRZE 4.32 БАКР. TELS S Sca URL ЖИНИ НАНЫ ЕЕ UL Ж 
以 受 如 和 何 测试 模拟 器 的 指导 。 

4.38 ФФ $ 

文件 ріре-ШІЗсі H: t S i$ П. БАУЕ 和 REBP МІЗ. БУ PEDE leave, REX 
ТЕЧ 4.33 中 描述 的 那样 。 可 以 参考 实验 资料 获得 如 何 为 你 的 解答 生成 模拟 器 以 及 如 何 测试 模拟 器 
的 指导 。 

4,39 ФФ4 

ХЕ pipe-nt.hcl 包含 一 份 PIPE 的 HCL 描述 ， 并 将 常数 J_YES EBAO RA ШЕФ 
的 函数 代码 修改 分 支 贷 测 返 辑 ， 使 之 对 条 件 转移 预测 为 不 选择 分 支 ， 而 对 无 条 件 转移 利 сап TA 
为 选择 分 交 。 你 需要 设计 一 种 方法 来 得 到 跳 转 明 标 地 址 valC， 并 送 到 流水 线 寄存 器 M， 以 便 从 错误 
的 分 文 预测 中 恢复 .可 以 参考 实验 资料 获得 如 何 为 你 的 解答 生成 模拟 器 以 及 如 何 测 试 模拟 器 的 指导 ， 

4,40 %%% 

文件 pipe-btfnt.hc] 包含 一 份 PIPE 的 HCL 描述 ， 并 将 常数 J_YES 声明 为 值 0， 即 无 条 件 转移 指 
令 的 函数 代码 。 修 改 分 支 预测 逻辑 ， 使 得 当 valC < valP 时 (后 向 分 支 )， 就 预测 条 件 转移 为 选择 分 
X. 23 valC > valP 时 《前 向 分 支 )， 就 预测 为 不 选择 分 支 。 并 且 将 无 条 件 转移 和 call 预测 为 选择 分 
交 。 你 需要 设计 一 种 方法 来 得 到 vac 和 valP， 并 送 到 流水 线 寄存 器 M， 以 侯 从 错误 的 分 支 预 测 中 
恢复 。 可 以 参考 实验 资料 获得 如 全 为 你 的 解答 生成 模拟 器 以 及 如 和 何 测试 模拟 器 的 指导 。 

4,41 %%% 

ERMIR PIPE 的 设计 中 ， 只 要 一 条 指令 执行 了 load 操作 ， 从 存储 器 中 读 一 个 值 到 寄存 器 ， 并 


是 下 一 得 指令 要 用 这 个 寄存 器 作为 源 操作 数 ， 就 会 产生 个 暂停 ， 如 果 要 在 执行 阶段 中 使 用 这 个 源 
井 作 数 ， 蜀 停 是 避免 冒险 的 惟一 方法 。 


JUS 44% 


eT xd PPS EW TFS ТН EAR. 例如 rmmovl 或 pashl Н>. Os S a PEI 
ЖЕП. t FBIEEUSA E. 


1 nrmovl П{%есх]!,%е@ейх B Lou d 
2 pushl Wedx # Mere ] 
3 пор 

1 popl tedy # Load 2 
5 rmmowl &éeax,0|*edx) 8 Sire 2 


在 第 1 行 和 第 2 行 ,mrmosvi M, fr ЖЕЕ — ТУЧИ еі. Ж puhi НА ІІІ А АЕ. 
我 们 的 PIPE ӘЗІР pushl ЕРЕН. СОЛЕ Е ЕТЕН АВЕ. Teu. иШ И, pushl fi^ EEUU 
HREHRLA S Egek mW. Ede Н E УРИН ИК. HE 469 >. НҮШ ЕШ (T yr 
m_valMy ЕНЕ M Pi val БІ. ТЕК +b BJ IE, Е ИНЕ A TER ИЕ 
Г. Wik Е SEES (load forwarding ). 


iË бын ¿ul | m ум 






ТІСТІ = 





CE E E T TTE amj 


Кт Ө 


mars =. 


图 469 ШШЕ Eo Erg uiro 
B rre Dn ЖАПЫ ШЙ ЖИЙ КИСИ А M 中 wan ПОШИ А. 01 1 x ge motu i We. Til LH BURN 
did. ТИИ e 441 的 主题 ， 
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ЕШ, СЕЕН ЧИЕ CR 4 FERE 5іт) 不 能 利用 加载 转 觉 ，popl b nta) 
V E Е-Е ЕДІН 6 S. TI BU BE MUI BB ШІ СЕТ. 

A. НЫН ИЕН ПЕНЕН НЕН, ЖЫР 454 е Н 8. RT E BRI E 
iehl SHE ELA 

B. ФЕ pipe-If.hel б PPE FERE SLE ИН. td EE new M valA Hp. AU 
EARR 4.69 К "Fwd А” НЕЙ. ЕЖЕНИН ТИП ИНИ ЮП PE HERE 
0, ШЕКЕ LP E A ERI CE RETE SCA f URP ERR. Же HCL МШЕ. 
TRER PLE qani STATE ЕЕЕ UL m er ЖБИ ЖЕЕ. 

442949 

ПДК ЕЛИН АЯ ЖИ. БОЖЕ УИГЕ TIROL. Ж Н pon 指令 需 要 
КУАР ИС РЕГАТЕ ET РА TE ME. ІНЕ, ШШЕ ЛЕШ Е С, AAAA valE 和 
vald. Pii Beim T eres. Кер, ШЕКЕ ИШ ID CW (НЕ 和 
W_dstM) 合 井 成 一 个 信号 w_dstE, МЕНЕЯҒНЕНД ОУ vae 和 W walM) 侣 并 成 一 个 信和 м valE: 


w wall 





== w (НЕ 


МЕ кі. 


用 HCL SAATA se jt mei, ШЕШ. 


LÄE w dstE = | 
Ей writing From vaiM 
БЕМ !- RHONE : W deth; 
1: W @зтЕ; 
l! 
int w valE = | 
W d&tM !- RMONE : W valH; 
L: W valE; 
|; 
бын НЕРІН ЕН dstE Е-Е ЖЕКШЕН. КЕНЕП E ТЇЇ. 
SR ШЕНЕП M 的 值 。 
ГЕНИЙИ, RYU] LE EQ f SYL М. ШЕШЕН HCL HOBBIES 
int w dstM = ВЕ: 
1nt w valM = Ü; 


HE FEIER ЯЙ ИНЕШ pop НІЛ, —Ю ЛИЕ НЕШЕ SE ds ih op RH + popl rA. 
Iz; FIR PIER а FE R. 


18001 $4, teap 
mrmovi -4[*eéap), ЕА 
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CETHA iadd 的 描述 ， 请 参考 家 庭 作业 4.32) 要 注意 两 条 指令 的 顺序 ， 以 保证 рор] Февр 能 正确 
工作 。 要 达到 这 个 日 的 ， 可 以 证 解码 阶段 的 惕 对 上 上 面 列 出 的 рор! 指令 和 addi 指令 - 视 同仁 ， 除 
了 它 全 参 测 下 一 个 PC 与 当前 PC 相等 以 外 。 在 下 一 个 周期 ， 再 次 取出 了 pop 指令 ， 但 是 指令 代码 
蛮 成 了 特 珠 的 值 IPOP2。 它 会 被 当 作 - :条 特殊 的 指令 来 处 理 ， 行 为 与 上面 列 出 的 mrmovi 指令 一 样 。 

文件 pipe-Iw.hcl 包含 着 上 面 讲 的 修 惧 过 的 写 端口 泌 辑 。 它 将 常数 IPOP2 声明 为 十 六 进 制 值 E. 
还 包括 信号 new D icode 的 定义 ， 它 产生 流水 线 寄存 器 D 的 icode FE TERRINE E 
当 第 一 次 取出 pop 指令 时 ， 插入 这 个 指令 代码 。 这 个 HCL 文件 还 包含 信号 fpc 的 声明 ， 也 就 是 标 
ы) “Select PC” 的 块 (E 4.560. 在 取 指 阶段 产生 的 程序 计数 器 的 伍 ， 

修改 该 文件 中 的 控制 逻辑 ,使 之 按照 我 们 描述 的 方式 来 处 理 popl 指令 。 吕 以 参考 实验 资料 获 街 
妇 何 为 你 的 解答 生成 模拟 器 以 及 如 何 测试 模拟 器 此 指导 。 


练习 题 答案 


练习 题 4.1 答案 


手工 对 指令 编码 是 非常 乏味 的 ， 但 是 它 将 巩 回 你 对 汇编 器 将 汇编 代码 变 成 学 节 序 列 汐 理解 。 企 
下 面 这 段 我 们 的 Y86 汇编 器 的 给 出 中 ， 每 一 行 都 给 出 了 “个 地 址 和 一 个 从 该 地 址 开始 的 季节 序列 。 


1 0х100: | .pos 0х100 # Start generating code at address 0х100 
2 0x100: 30830r000002 | irmovl 515,%ерх 

i Өхіре: 2031 | rrmovl Жерх,Фесх 

4 0х1068: | leop: 

5 0х108: 4d0]3zdffffff | rnnovl Фесх,-3 (жерх) 

ë 0х10е: 5031 | addl ерх, жесх 

7 0x110: 7008010600 | jmp loop 

这 段 编码 有 些 地 方 值 得 注意 ; 


. 十进制 的 15【 第 2 行 )》 的 十 六 进 制 表 未 为 0x0000000f。 以 有 反问 顺序 来 写 就 是 0f 00 00 00. 

`. 十进制 -3〔 第 $5 行 } 的 十 六 进 制 表 示 为 Oxffrfifd. UL Bc pu M T3053 fa ff ff ff. 

s ”代码 从 地 址 0x100 开始 。 第 和 指令 需要 6 个 字 节 ， 而 第 二 条 需要 2 个 字 节 。 因 此 ， 黎 环 

的 日 标 地 址 为 0х00000108. À F [nl WE Pr SEE S P Ж. 08 01 00 00. 

练习 题 4.2 ЖЕ 

+ гї] 个 空 入 序列 进行 解码 能 帮助 你 理解 处 理 器 面临 移 任 务 。 它 必 山 读 入 学 市 序列 ， 开 确定 
该 执行 什么 指令 。 接 下来， 我们 给 出 的 是 用 来 产生 每 个 字 节 序列 的 汇编 代码 。 在 汇编 代码 的 诺 这， 
fi n ELE SURE SK TR PERO E Pel. 

A. WW SR ИН RE НУ TE 


üxlüD: 308JIÍCEEIEII ! irmovi 5-4,*ebx 

Oxl06: 406300580000 | rmmovl Жәнзі,ПхЕСП (арх: 
xic: 18 | halt 

B. & e — eX RB C. 

Пх200: ай58 | pushl $esi 


0х202: 8008020000 | call proc 


ALES P K £ HET 3!1 


0х207: 10 | halt 

Пх208: IDnroac: 

Ox2068: 30830a000020 | Ü»rmovl 510, %ерх 

0x20e: 90 | гек 

C. ASIER HR п 0х[0 BOIS, 

0х300: 505407000020 | mrmovl 7?I%espi,%ebp 

0x366; 00 | пор 

0x307: £0 | Byte Oxf0 # invalid instruction code 
0x308: b018 | popi %есх 

D. &á — "Eg SERO. 

0х400: | Loop: 

Ох400; 5113 | subl £ecx, %ebx 

0x402: 7306040000 | je loop 

0x407: 10 | halt 

E. pushl 指令 中 第 二 个 字 节 为 非法 的 代 色 ， 

0x500: 5362 | xorl %esl,*edx 

0x502: aD | буге бхай # pushi instruction code 
0Хх003: ВО | -byte бхВб # Invalid register byte 

练习 题 43 答案 


下 如 题 昌 中 建议 的 埋 样 ， 我 们 修改 了 [LA32 机 器 上 的 GCC 产生 的 代码 : 


# int Sumiint *Start, int Count) 
ršum: pushl sebr 
rrmovi Жеср,%ерр 
irmovl 520,Феах 
амр1 Феах,Фево 
pushl &ebx 
mrmovl 8í(£ebp],*ebx 
mrmovi 12í(X*ebp),S$eax 
andl Жеах,%еах 
jle 138 
irm2vl 5-8, еіх 
addl %ейх,%евр 
lrmovl 5-1, %едх 
addl Фейх, %еах 
pushl $eax 
irmovl 54,&£€edx 
rrmovl *ebx,*eax 
айа *edx,£eax 
pushl %eax 
call r5um 
mrmovl {ФеБху, Фейх 
addı жейх, %еах 
jmp 1,39 
29: хоті %оеах,Жеах 
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139: mrmov] -241%5сЫыо) ерх 
rrmovl &ebp,*esp 
pool *sbp 
ret 
练习 题 4.4 答案 
盟 然 很 堆 想像 这 条 指令 有 什么 实际 用 处 ， 寻 是 在 设计 系统 时 ， 吉 免 在 这 种 情况 中 出 现 战 义 契 北 
霹 蝇 的 ,我们 中 为 这 条 指令 的 行为 确定 - -种 合理 的 解释 懂 例 ， 并 确保 每 个 实现 部 遵守 了 这 个 惯例 。 
这 个 测试 中 subl 指令 比较 了 %esp ЖИЕНІ A ВНЕЛЕ. AERE А 0, DUCERE КАН 
E AC Фезр АЖЕН. 


练习 题 4.5 ЖЖ 

TED EL SA K Bak ИИН ЕН НҚ. dox. ШЇ ae НЕ МАР ЕИ C. 
МНЕ ға KAR P. ЙІНЕ ерін, ДОШ S ALS БАН Ж Руа, Ai uj 
推断 出 рор! wesp M RB PRISE Е АА T Sep Н fL. АҢ, СЕЗЕТІН» mrmovl 


ПІЗеврі. $esp- 


ТЕ”, 


练习 题 46 EX 
EXCLUSIVE-OR (hk) 阴 数 至 求 两 个 位 有 相反 的 什 ; 
поо ec = iia E& b) | là && Ib): 


ШЕ, {с=с eg 和 xor 是 五 补 的 。 也 就 是 ， “个 等 于 1， 万 一 个 就 等 于 0. 

练习 题 4.7 答案 

EXCLUSIVE-OR 所 路 的 输出 是 你 相等 值 的 补 。 根据 德 摩根 定律 同 2,72, 我 们 能 用 OR RI NOT 
实现 AND， 得 到 如 下 市 路 





Шек 
XOr 一 
84. 一 一 
ba — ! еду, 
Хог 
ӛз —— 


5485Ж 
Ж Км АДАА, ШАТ ШЕ МЕНМІН ВАС. 


int Med3 - | 
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А <= B kk B <= C : B; 
B <= А && A <= C t А; 
1 : С 
l: 
练习 题 4.9 答案 
这 些 练习 使 种 个 阶段 的 计算 更 如 其 体 。 从 品 标 代码 中 我 们 可 以 看 到 , 指令 是 位 下 地 址 0x00e 的 。 
CAR 6 个 字 节 ， 前 两 个 字 节 为 0x30 和 0x84。 后 由 个 字 节 是 0x00000080 十进制 128) F 节 反 
过 来 的 形式 。 


一 
иту 5128, tesp 


icode:ifun + МРС] icode;ifun 一 Mi[üx00e]=jÉ: 0 
ГАВ МРС+1] АТВ + Mj[0x05£]38 : 4 
valc — M4[PC42] valC 一 М40х8410|в128 
valP -- РС+6 mE + бхйбе+б=0х014 


АВ] 一 valE —— = walE-123 
Wp PC РС + valP PC — valP = 0х014 


JU ЧЕЗ ЖЖ besp RA 128， 并 将 PC HB 6. 


练习 题 4.10 答案 

我 们 可 以 看 天 指令 位 于 地 址 OxOle, AAAH, 2) 9 OxbO 和 0х08. push 指令 (第 65 行 } 
шы ЖІ 124, ЖЕР ЖЕ ЖЕН 9. 
am ___ Ав 


Rode'ifun 一 МРС) wode:itun — МИШІхО1С Ер: 0 
ГАВ — М[РС+1] TATB — Mj[oxola]-0:8 








% 




















取 指 













valP — PCG+2 valP -- üxüic«2-üxüle 
ҰША — [ев] Yal — КІЗегрін124 
valB — КІ авар! valB -- R|*€esr]2124 
vaiE 一 valB+4 valE — 1243442128 
уам — Maval] valM — M4[:22]- 


R[&esp] ~ valE R[&esp] 128 
- *- valM B[&esp] + 9 
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iia Феах 197) 9. H besp КЖ 128, PE PC ІП 2. 


练习 题 4.11 ЕЖ 
AUR] 4.18 ШЕ НОР, Ж A 看 成 名 esp， 我 们 可 以 看 到 ， 人 条 访 丰 阶段 ， 指 全 会 将 valA СЕП 
HME ARIO EAER SRE TA 中 发 现 的 一 样 : 


练习 题 4.12 答案 

HAR 4.18 rp] PESE, тА 看 成 mesp， 我 们 可以 着 到 ， 商 个 瑟 回 操作 都 会 更 新 名 esp。 内 
АҢ valM 的 标 作 后 发 生 ， 指 令 的 最 终 效 打 会 其 将 从 存储 器 中 读 出 的 估 写 入 %esp， 占 像 企 [A32 中 看 
到 的 - FE, 


练习 题 4.13 答案 

我 们 可 以 看 到 这 条 指令 位 于 地 址 0023, ЕЕЛ5 ЧЕН. Ж AFTEN 0x80， 而 后 面 4 
TT WR 0х00000029, ENAH AI Hbc RE FE CERO E SA. po 指令 O3 7 112 RREA 
128. 







icodaifun — MPE ICode'fun — Mj?2xo023]28:2 














val = М[РС+1] valC 一 M [Dx 024] 0x 023 
valP — РС+5 valP — 0х723+5=0х028 


жн 
valB — R[*es:| valB 一 R[£&esp|-123 
valE — valBa-4 valE — 1285-4224 






IX IB pha sk E pep ЭУ 124, Ж 0x028 {返回 地 址 ) 存放 到 该 存储 器 地址 ， 并 将 PC 
A 0x029 CHH R N НАН). 


练习 题 414 答案 
练习 题 中 所 有 有 的 HCL НИЕНІ ТӨН), 但 是 试 着 月 己 宇 会 帮助 你 妃 关 各 个 指令 ， 站 及 如 何 处 
章 避 和]， 对 十 这 个 问题 ， 我 们 只 要 看 看 Y86 的 指令 集 (E A20, Ажат В, 
bool need vall = 
іссйе in | IIRMOVL, IRMMOV U, 1МЕМОУТ,, TJXX, ICALL |}; 
练习 题 4.15 管 案 
А ВИКЛ Г згд 的 代码 ， 


ЖЕ Ж. Ж ЖЕЗ) 


int srcB = [ 
icode in { ТОР, IRMMOVL, 
jcode 1л { IPUSHL, 


1: RNONE: 


IPOPL, ICALL, 
# Don't need register 


]; 


45416 答案 
IX ВИА dstE 的 代码 : 
int dstM = | 
iccde іп | IMRMOVL, IPOPL ) : rà; 


1l : ENONE; # Don't need register 
1; 


IMRMOVL j : 
IRET ) 
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rB: 
: AESR; 


练习 题 4.47 答案 
像 我 们 在 练习 题 412 中 发 现 的 那样 , 为 了 将 从 存储 器 中 读 出 的 值 存放 到 和 esp, 我 们 想 让 通过 М 
ЛЫНАН ГЛ ЕП. 
练习 题 4.18 答案 
ЖЕН Е alua 的 代码 ， 
int aluB = | 
icode in ( IRMMOVL, IMEMOVL, IQPL, ICALL, 
IFUSHL, IRET, IFOPL J| : valEB; 


іссйе in ! IRRMOVL, IIRHOVL ) : 0; 


& other instructions don't need ALU 


1; 
з] 4195Ж 
这 段 代 码 类 似 于 тел addr 的 代码 : 


int mem_data = [Í 


# Value from register 


icode іп í IRMMOVL, IPUSHL ) ; уз1А; 
# Return PC 
icode == ICALL : valE:; 


# Default: Don't write anything 
1; 


练习 是 4.20 答案 
这 段 代 码 类 似 下 mem read 的 代码 ; 


Dool mem write = icode in { IRMMOVL, IPUSHL, 


ICALL j; 
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练习 题 4.21 ме 

А RA ETE RERO]. РАИ ШИН КИЕ. ОИ Y UK £x T] 
ГЕН m EAT И 

А. ЖАВ Я, ДЕВ ТАЕ A. ВАС 在 第 一 阶段 , ER D. EA FER Л 
Br. Ж ТЕНЕ Ж 170ps， 所 以 整个 周期 的 时 长 为 170+20=190ps。 因 此 吞吐 其 为 5.26 GOPS, 
而 换行 时 名 为 380ps. 

B. Я— ИИ KEE ЖИ, МА BTE СЫЯ, АСЯ Ор Ж BE. m3 E H 
ЕЕ Е. ШЫЛ EC ШЕН А ops MARTERA E: 130рв. ПІРІН; EA 7.69 GOPS. 
girl] fa] 7) 390ps. 

C. 对 РЛЕРІ ЖЕ ЖИ, RAAR ТЕ, ВАСИ ІН, RD ERM. m 
EEA FARME ELSE 90р. ТЫНЫН БОЛ ПОрв, m den Est); 9.09 GOPS. 
TA TTIN [5] Jj 440ps ; 

D. EIEEE ЕЛ ИҚ RT EFATE ТРЕК. АЯМА OBERE. 
ls Sur IE S0-202100ps. Ani A. £3 10.00 GOPS, iig dA TT HE E 500рѕ. Ж E ИАА Л 
会 有 帮助 了 ， 轩 为 不 可 能 使 流水 线 运 行 得 比 以 100ps Jy — S] RE ИИ Т. 


练习 题 4.22 ЖЖ 


在 这 种 械 限 情况 下 ;流水 线 的 每 个 让 算 所 的 途 壕 邦 为 e ns。 时 钟 同期 为 e+20 ps, E RE А 1000/(e 
420) ШЕЛ КА. к Ait etli AN 50.00 GOPS. 


% 习题 4.23 答案 
XX BH ORI д5 SEQ АЧ = 了 НІ Hin E: gu es "D 
int new E astbE-[ 


D :ccde іг { IRRMOVL, IIRMOVT, IGPL; : D rB; 


D 1code іп + ТЕС, ТРОРІЫ, IUALL, IRET * : REST; 
1 : BNOXE; ғ Don't need register 

1; 

练习 题 4.24 答案 


HL] pop 指令 【第 站 行 》 这 成 的 如 载 / 使 用 月 由，rmrmmoyvl 指令 C335 82 m TES). "i 
БАРА, рор! 指令 处 于 沪 存 阶段 ， fr MdstE 和 M.dstiM А ер. 0 SP К, 
MAREA M_valE НИТ ЕЕ Ғы, TAURI Г REEE mmovl НАШ. 1x 158 
2] 8 4.5 中 确 定 的 处 理 pop! %esp TH B 48 33 

练习 题 4.25 Ж Ж 

МН ЛАЖ МӘНЕРІ -МЕНЕШІМЕК--А- РАН А ОВЕ ВЕ. OB 
ms ARM НІМ k El k PT G ІН ken HEE m HER ХЕ АЙАН, sg selo kB 

ПЁ Ж. 
ATPL ҖИ п) ЛЕ НАЖ 11И АСАП ЛТ ТИШИ T kO AK; 


-Je aun am м B3 ғ 
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irmovl 55, Жейх 
irmovl $0x100,*esp 
rmmovl Фейх, 9 (%еѕр! 
popi $esp 

пор 

пор 


rrmovl Февр, %еах 


两 个 nop 指令 会 导致 当 rmovl 指令 在 解码 阶段 中 时 ，popl ЕА А. КАТАРЫ 
司 阶段 中 的 两 个 转发 源氏 小 的 优先 级 ,那么 寄存 器 %eax 会 设置 成 增加 了 的 程序 计数 器 ,而 不 是 从 存 


情 器 中 读 出 的 值 。 

练习 题 4.26 答案 

D ЕЕ Um ЖЫ ЕЛЕЕ УЕ: 

int new E valB = | 
d src3 == E dstE : e valE; # Forward valk from execute 
d &rcB == M dstM : m valM; # Forward vaiM Irom memory 
d src28 == M dstE : M, valh; # Forward valE from memory 
d serc5 == W dsLM : W маім: # Forward valM from write back 
d src3 == W dstE : W valE; # Forward valE from write back 
1 ; d rvalB:; # Use value read from register file 

1; 

练习 题 4.27 ЖЖ 

下 面 这 个 测试 程序 是 设计 用 来 建立 控制 组 合 A (84,67) ШЕЛІ Тїз: 

1 # Code to generate a combination of not-taken branch and ret 

à irmovl Stack, Феѕр 

3 irmovl rtnp,t*eax 

4 pushl Феах Ж Set up return pointer 

5 Xorl %еах,%еах # Set 2. condition code 

6 Jne target # Not taken (First part of combination) 

7 irmovl 51,%еаҳ # Should execute this 

8 halt 

9 target: ret # Second рап of combination 

10 irmovi $2,€ebx # Should not execute this 

11 halt 

12 rtnp: irmovl $3,&edx F Should not execute this 

13 halt 
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14 „роз 09х40 
15 Stack: 


设计 这 个 程序 是 为 了 出 错 【 便 如 实际 上 执行 了 rel 指令 ) 0], EFRI ARAR irmovl 18 
令 ， 热 后 你 止 。 因 此 ， 流水线 中 的 错误 会 叶 狗 某 个 寄存 器 更 新 错误 。 这 上 段 代码 说 明 实 规 测 试 程序 第 
ЖМ vr eR ИНЕ ӨЗ, АЕАНИШЕ БНАЖ. 

练习 题 4.28 EX 

下 向 六 个 测试 程序 是 设计 用 来 建立 控制 组 合 B (图 462 的 。 模 所 器 会 发 现 流 水 线 寄存 器 的 气 
汽 利 暂停 控制 信号 都 设置 成 0 的 情况 ， 因 此 我 们 的 测试 程序 只 需要 建立 它 融 要 发 现 的 组 全 情况 ， 牙 
ХИТ АМ ТАМЫ, ЕЛЕНЕ ТІНЕ. 


# lest instruction that modiftes еур followed by ret 


2 irmov. mem,%ebx 

3 mrrovl 9 ізебх),Фезр # Sets Жезр to point to retum point 
4 ret # Returns to return point 

5 halt # 

б rtnpt: irmovl $5,$esi & Keturn point 

7 kalt 

Б .pos 2х40 

5 тетп: .long stack # Holds desired stack pointer 

14 ‚ров üUxb5iü 

- 1 stack: leng rtnp-c # Top of stack: Holds return point 


РЕҢМЕН 了 存储 器 中 两 个 初始 化 了 的 字 。 第 - -个 字 (mem) 保存 着 第 一 个 字 (stack 一 一 期 
ЭНЕНЕ E ae BAREH ret 指令 期 望 的 返回 点 的 地 址 。 这 个 程序 将 栈 指 针 加 载 到 名 esp， 
省 执行 ret 指令 ， 

练习 题 4.29 答案 

М 4.66 我 们 可 以 看 到 ， 由 于 加载/ 使 用 肯 险 ， 流 水 线 寄 在 器 D 必须 暂停 。 

boo. D stall - 

# Conditions for a ісай/иве harard 
R code in { iMRMOVL, IPOPL } && 
E dstM in ( d srcà, d srcB +}; 


练习 题 4.30 ЖЖ 

M f 4.66 HER IRE ИЯ, ШЕЖЕ ШЕЮ. ЕНЕ ЖЕЖШЕНЯ, ЖАМАН E X, 
ЖЕЛЕЗІ; 

bool E bubble = 


# Mispredicted branch 
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(E icode == СПХХ Ев !e Bch) |! 

# Conditions for a load/use hazard 

E icode in 1 IMRMOVL, IPOFL } && 
E detM in ( d srcA, d srcB;; 


练习 题 4.31 管 案 


此 了 时， 预测 错误 的 频率 居 0.35, 得 到 пр=020х 0.35 х2=0.14, 而 整个 CP] 为 1.25。 看 上 去 路 
获 非 常 小 ， 但 是 如 果实 现 新 的 分 葡 祯 测 策 酷 的 成 本 厅 是 很 吉 的 话 ， 这 梓 做 还 是 俱 得 的 。 
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НЕЛЕР EAR S. Bl bd XE SAM BSGBGEAS E So, ER 
25 a h A ЖЕНЕ ЖЕН CDL IG UL Ru RT UT ICE IC. Xp РА 8. HARALA UE 
2x A BE AAI BE XR ЖШ. ЫП, АЕ Лур САМАРА, $25 dH И 
化 方式 很 人 的 变化 。 有 些 编程 语言 比 上 其他 语言 容易 优化 得 多。C 的 有 些 特性 ， 例 如 执行 指针 运算 种 
晶 制 类 型 转换 的 能 力 ， 使 得 对 它 惰 化 很 困难 。 程 序 员 经 常 能 够 以 一 种 使 编 详 品 更 容易 产生 总 效 代 权 
的 方式 来 编写 他 们 的 程序 。 

在 称 序 开发 和 优化 的 过 程 中 ， 我 们 攻 须 兰 虑 代 冯 使 用 的 方式 ， 以 龙 影 响 它 的 关键 因素 。 通 第 ， 
程序 员 几 须 在 实现 和 绯 护 程序 的 简单 性 与 它 的 运行 速度 之 间 委 出 税 衡 折 课 - ERTER Г. ЛР, 
能 编写 一 个 简单 的 搬入 排序 ,而 -- 个 高 效 的 排序 算法 程序 可 能 需要 一 天 或 更 长 的 时 间 来 衬 现 和 优化 ， 
在 代码 级 |-， 许 多 低级 别 的 优化 往往 会 降低 程序 的 叮 读 性 和 模块 性 ， 使 得 程序 容易 出 销 ， 更 准 以 收 
改 或 扩展 。 上 起 十 一 个 只 会 运行 一 次 以 产生 一 组 数据 点 的 程序 ， 以 一 种 尽量 减少 编程 工作 量 并 你 证 十 
确 性 的 态 式 来 编写 程序 就 更 为 重 柴 一些。 对 于 会 在 性 能 非常 重要 的 环境 中 反复 执行 的 代码 ， 例 如 网 
ЖН, XE EI УКИДЕ - 些 ， 

在 本 章 中 ， 我 们 描述 许多 提高 代码 性 能 的 技术 。 ИШИНЕ. БЕЙНЕУ АН IE 
何 代 人 档 ， 并 产生 仿 吕 能 高 就 的 、 县 有 指定 行为 的 机 器 级 程序 。 事 实 上 ， 编 详 器 只 能 执行 有 限 的 程序 
转换 ， 而 用 妨碍 优化 前 因素 《optimization blocker) 还 会 阻碍 这 种 优化 ， 妨 得 优 化 的 因素 岁 嘴 程序 行 
为 中 那些 严重 依赖 于 执 行 环境 的 方面 ， 程 序 员 必 须 编 所 容易 优化 的 代 耕 ， 以 帮助 编 详 如 。 头 绝 详 明 
来 说 ， 编 译 拱 术 被 分 为 “与 机 器 无 关 ” 和 “与 机 路 有 关 ” 两 类 。“ 与 机 中 无关” 的 意 轩 是， 使 攻 这 些 
技术 时 可 以 不 考 让 将 执行 代码 的 计算 机 的 特性 ， 而 “与 机 器 有 关 ” 是 指 ， 这 些 技术 是 依赖 于 许 允 机 
器 的 低级 细作 的 。 我 们 的 讲述 也 沿用 了 类 似 的 顺序 , АНЕ ЭЕ ИЛТЕР E Т НЕЕ RR. 
然后 讲 效 认 依 赖 于 丹 标 机 器 和 编 详 器 特性 的 转换 。 这 些 转 换 通常 还 会 降低 代码 的 模块 性 和 品读 性 ， 
因此 ， 应 该 让 获得 碟 大 性 能 是 首要 日 标 时 ， 才 使 用 这 些 技术 。 

为 了 使 程序 性 能 最 大 化 ， 程 岩 册 和 编 详 器 需要 一 个 目标 机 器 的 模型 ， 指 明 如 和 何 处 理 指令 ， 雯 及 
各 个 皖 作 购 时 序 特性 。 例 如 ， 编 详 器 必须 知道 时 序 信 息 ， 才 能 够 确定 是 下 要 ЖУАН». ЖЕН 
和 加 法 的 基 种 组 合 。 现 代 计算 机 几 复 杂 的 技术 来 处 十 机 器 级 程序 ， 并 行 臣 行 许 多 指令 ， 而 用 执行 
腑 友 还 可 能 不 同 于 它们 在 程序 中 出 现 的 脐 序 。 程 序 员 必 须 理解 为 了 获得 最 大 的 速度 ， 这 些 处 理 器 是 
如 何 工作 来 调整 程 夺 的 。 基 于 Intel 处 理 器 的 最 新 模型 ， 我们 提出 了 - -个 这 种 机 器 的 癌 级 模型 。 我 们 
述 届 计 了 一 种 图 形 表 示 法 ， 可 以 用 束 合 处理 器 执行 指令 形象 化 ， 并 且 还 可 以 预测 程序 性 能 。 

找 和 以 对 优 亿 太 弄 程序 的 问题 的 讨论 来 结束 这 A. 我 们 描述 了 民 码 剖析 程序 Cprofilers) 的 使 
用 ， 人 代码 旗 析 程 序 是 测量 悍 序 各 个 部 分 性 能 的 工具 。 这 种 分 析 能 够 帮助 找到 代码 中 低 效 率 的 地 广 ， 
FHETT TRIMAA RULES SEAT. 最 后 ， 我 们 给 出 了 一 个 重要 的 规 察 结论 《 称 为 Amdahl 
定律 )， 它 量化 了 对 系统 某 个 部 分 违 行 优化 所 带 来 的 整体 效果 。 

芋 .本 章 的 撞 述 中 ， 我 们 使 每 代码 优化 在 起 素 像 接 照 某 种 特殊 顺序 ， 对 代码 进行 一 系列 转 换 的 简 
单线 性 过 程 。 实 际 上 ， 这 项 工作 远古 这 么 简单 。 需 要 相当 多 的 试 错 法 试验 。 当 我 们 进行 到 乒 面 的 优 
化 阶 委 本， 这 种 三 法 区 其 有 用 ， 到 那 时 ， 看 上 去 很 小 的 变化 会 导 臻 性 能 上 很 大 的 变化 。 相 反 ， 一 些 
很 有 硕 刘 的 拔 术 被 证 明 是 无 效 的 。 正 如 我 们 在 后 面 的 例 了 中 看 到 的 于 样 ， 要 确切 解释 为 什么 其 段 代 
妈 太 列 太 某 个 执行 时 间 ， 是 很 困难 芍 。 性 能 可 能 依赖 十 处 理 器 设计 的 许多 详细 特性 ， 而 寺 此 我 们 所 
知 其 少 。 这 也 是 我 们 尝试 各 种 技术 的 变形 和 组 合 的 另 一 个 诛 因 ， 
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BUT MAVI ЖЕЛЕ RA НЕЛЕ bl R Е УК B SETRA СРО FE 2.—. FARRA (ДЕ 
的 代码 是 一 个 很 好 的 开端 。 人 人们 可 以 确认 降低 性 能 的 属性 ， 例 如 过 多 的 存储 器 (memory) 引用 和 对 
寄生 器 不 正确 的 使 用。 从 汇编 代码 开始 ， 我 们 甚至 可 以 预测 什么 损 作 会 并 行 执行 ， 以 及 它们 使 用 处 
ERR EE UR HJ ЯЕ BT fE. 


5.1 IK SAYS sa B RENA БО 


BA Van k ase HI ИЕН ЖЕ ARERR HEA E, 以 及 它们 是 被 如 何 使 用 的 。 
然后 它们 会 利用 一 些 机 会 来 简化 表达 式 ， 也 就 是 在 儿 个 不 同 前 地 方 使 用 个 计算 ， 以 降低 一 个 给 定 
的 计算 必须 被 执行 的 次 数 。 编 译 器 优化 程序 的 能 力 受 几 个 因素 限制 ， 包 括 ， 竖 求 它们 绝 不 能 改变 正 
确 的 程序 行为 ， 它 科 对 程序 行为 、 对 使 用 它们 的 环境 了 解 有 限 ， 需 览 很 快 地 完成 编 详 工作 。 

编 详 器 优化 对 用 户 来 涪 应 该 是 不 可 见 的 。 当 程序 员 用 优化 选项 例如， 使 用 -O 命令 行 选项 ) d 
详 代 码 时 ， 代 码 的 行为 应 谈 和 不 带 化 化 编译 得 到 的 代码 行为 完全 一 样 ， 除 了 它 应 该 运行 得 更 快 一 点 
以 外 。 习 样 的 要 求 使 得 编译 器 不 能 使 用 某 些 类 型 的 优化 。 

РШ, 418 КАЮТА. 
void twicdlel(int *xp, int *yp) 

{ 
*хр += "yD; 
“ыр іс “ур; 


void twiddle2[int *xp, int *yp) 


1 
2 
3 
1 
5 ] 
Š 
7 
3 { 
9 


*хр -= 2% жур; 

10 1] 

Еж, ХИ АННА ЕЕЕ НТ OS CREAF {ТЕШНЕ yp Жл И 8 ARE BO (EDS ТАШ 
到 指针 xp 指示 的 位 置 处 的 值 。 另 一 方面， 函数 twiddle2 效率 更 高 一 些 。 它 只 要 求 -次 存储 器 引用 
С *хр, W*yp, Бахр), HU twiddlel 需要 六 次 (两 次 读 #xp， 两 次 读 *+yp， 两 次 写 *xp)。 因 此 ， 如 
An tE sa ЖЕ widdle1， 我 们 会 认为 基于 twiddle2 执行 的 计算 能 产生 更 有 效 的 代 公 。 

不 过 ， 考 虑 一 下 xp 等 于 yp К. JE, A% twiddlel 会 执行 上 面 的 计算 ， 

3 *xp += *xp; /* Double value at xp */ 

4 *xp += *xp; /* Double value at xp */ 

结果 会 是 хр НЕНІ 448. 5 方面， 函数 twiddle2 dtr ЕШ B: 

3 “хр += 2* *xp; /* Triple value at xp */ 

Ame xp 的 值 增加 3 倍 。 编 译 器 不 知道 twiddlel 会 被 如 何 调用 ， 因 此 它 必 须 假 设 参数 xp 和 
ур 可 能 会 相等 。 因 此 ， 它 不 能 产生 twiddle2 风格 的 代码 作为 twiddlel 的 优化 版 本 。 

这 个 现象 称 为 存 届 器 别名 使 用 (memory aliasing)。 编 译 器 必须 假设 不 同 的 指针 可 能 会 指向 存储 
器 中 同一 个 位 置 。 这 造成 了 个 主要 的 妨 王 优化 的 因素 ， 这 也 是 可 能 注重 限制 编 详 器 产生 优化 代码 
机 会 的 程序 的 一 个 方面 。 
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ЕО 5.1 

КЕЎ] Ж T ARER eR Ж ЖО Л бт ДТ ЖИЛ K. +Ë F ЮА y 4 
BAA А8; 

1 — f*Swap value x at xp with value y at yp */ 


2 volé swapíint *xp, int *vp! 

3 [ 

4 *xp = *xD + *ур; /* x+y *j 

5 күр = *xp - хур; ##х+у-у=х*! 
6 *хр = %хр - *yp; #*х+у-х=у#[ 
? } 


如 末 调 用 这 个 过 程 时 хр 等 于 yp， 会 有 什么 样 的 效 采 ? 
第 二 个 妨碍 优化 的 因素 是 函数 调用 。 作 为 一 个 示例 ， 考 虑 下 面 这 两 个 过 程 : 


1 int f[int); 


2 

3 int funrcliíx) 

4 l 

5 return fix) + Fix) + fix) + fix 
6 | 

; 

8 int func? (х) 

9 l 

11) return 4%5ҒЕ (x); 

11  ! 


RHS LEATHA KAREHA, ІНЕ fune2 RWA Ғ--Ж. T fancl ЙН f PUPA. 
以 funcl 作为 源 时 ， 会 很 想 产 生 fune2 风格 的 代码 。 
АА, ЖШ FH t 的 代码 ， 


int Counter” = D; 


1 

à 

3 int fiint x) 

4 | 

5 return counter++; 
Ü | 


这 个 国 数 有 个 副作用 -一 它 履 改 了 全 局 程序 状态 的 一 部 分 。 改 变调 用 它 约 次 数 会 改变 称 序 的 行 
为 。 特 别 地 , 假设 开始 时 全 局 变量 counter 都 设置 为 0, 对 funcl 的 调用 会 返回 0414243=6, 而 对 func? 
的 调用 会 返回 40=0。 

大 多 数 鸯 译 器 不 会 试图 判断 一 个 的 数 是 否 没 有 副作用 ， 因 此 任意 嚼 数 都 可 能 是 优化 的 候选 者 ， 
例如 func? 中 的 做 法 。 相 反 ， 编 译 器 会 假设 最 糟 的 情况 ， 并 保持 所 有 的 前 数 调用 不 变 。 

在 各 种 编 详 器 中 ，GNU 编译 器 GCC 被 认为 是 胜 企 的 ， 但 是 就 它 的 优化 能 力 来 说 ， 并 不 是 特别 
突出 。 它 完成 基本 的 优化 ,但 是 它 不 会 对 程序 进行 更 加 “有 进取 心 的 ” 编 详 器 所 居 的 那 种 激进 变换 ， 
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因此 ， 使 用 GCC 的 程序 员 必 须 花费 更 多 的 精力 ， 以 -- 种 简化 编译 器 生成 高 将 代码 的 任务 的 方式 来 
编写 程序 。 


5.2. 表示 程序 性 能 


我 们 需要 一 种 方法 来 表示 程序 性 能 ， 它 能 指导 我 们 改进 慌 码 。 对 许多 程序 部 很 有 用 的 度量 标准 
是 每 元 素 的 周期 数 (cycles per element，CPE)。 这 种 度量 标准 帮助 我 们 在 更 话 细 的 级 别 上 理解 选民 
程序 的 循环 性 能 。 则 时， 这样 的 度量 标准 对 执行 重复 计算 的 程序 来 说 也 是 很 适当 的 ， 例 如 处 理 图 像 
中 的 像素 ， 或 是 计算 矩阵 乘积 中 的 元 束 。 

处 理 器 活动 的 顺序 是 由 时 钟 控制 的 ， 时 钟 提供 了 某 个 频率 的 规律 信号， 要 么 用 兆赫 花 〈MHz， 
ШЕРИЕРО 来 表示， 要 各 用 千 兆 赫 益 (GHz, ИЛЕ) 来 表示 。 例如 , 一 个 系统 有 “1.4GHz” 
处 型 器 ， 这 表 水 处 理 器 时 钟 运行 频率 为 1400 兆赫 兹 .每 个 时 负 周 期 的 时 间 是 时 钟 频率 的 倒数 ， 通 党 
БЕЛІ ЯР (nanosecond, Fae- BO 来 表示 的 。 一 个 2GHz 的 时 钟 其 周期 为 0.5 练 秒 ,， 而 500MHz 
的 时 种 ， 周 期 为 2 纳 秒 。 从 程序 员 的 角度 来 看 ， 用 时 钟 周期 来 表示 度量 标准 要 比 用 纳 秒 来 表示 有 者 
助 得 多 。 用 时 钟 周期 来 表示 ， 度 量 值 不 赤 依 束 于 被 评估 的 处 理 器 的 模型 ， 而 这 些 度量 值 能 帮助 我 人 
确切 池 理 解 机 器 是 如 何 执 行程 序 的 。 

VERG Si EXEC HA. 例如， 图 5.1 中 的 消 数 vsum] 和 vsum 计算 的 都 是 
两 个 长 度 为 的 同 量 之 和 。 第 一 个 函数 每 次 迭代 计算 目标 向量 的 : -个 元 素 。 第 一 个 国 数 使 用 称 为 御 
环 展开 (loop unrolling) 的 技术 ， 每 座 迁 代 计 算 了 两 个 元 素 。 这 个 版 本 乓 对 ЖЕЗДЕН. ЖАН 
后 面 ， 我 们 将 更 人 详细 地 介绍 御 外 展开， 包括 如 何 使 它 对 任意 于 的 值 部 有 效 。 

这 样 一 个 过 程 所 需要 的 时 间 可 以 用 - 仿 常 数 加 上 一 个 与 被 处 理 元 素 个 数 成 正比 的 因 了 来 描述 。 例 
如 ， 图 5.2 EKAT ARRENE ЖААН АТ п 值 的 取信 范围 图 。 使 用 最 小 二 来 方 拟 合 《Jeast 
squares fit), 我 们 发 现 , 两 个 图 数 的 运行 时 间 ( 朋 时钟 周期 表示 ?分 别 近 伏 于 表达 式 80+4,0п 和 83.5+3.5n 
的 线条 。 这 两 个 表达 式 表 明 初 始 化 过 程 、 准 备 循环 以 及 完成 过 程 的 开销 为 50-84 个 周期 加 上 每 个 元 
束 35 或 40 周 期 的 线性 因子。 对 于 较 大 的 于 的 值 ( 比 如 说 ， 大 于 人， 运行 时 间 就 会 主要 由 线性 因子 
来 决定 。 我 们 称 这 些 项 中 的 系数 为 每 元 素 的 周期 数 〔 简 称 СРЕ) 的 有 效 数 注意， 我 们 更 愿意 用 每 个 
元 素 的 周期 数 而 不 是 每 次 循环 的 周期 数 来 度量 ,， 这 是 因为 像 循 环 展开 这 样 的 技术 使 得 我 们 能 够 用 较 少 
的 入 环 完成 计算 ， 而 我 们 最 终 关 心 的 是 ， 对 于 给 定 的 向 量 长 度 ， 程 序 运行 的 速度 如 何 ， 我 们 将 精力 集 
中 在 减 小 我 们 计算 的 CPE b. 根据 这 种 度量 标准 ，vsum2 的 СРЕ 为 3.5， 优 于 CPE 为 4.0 的 ysuml。 


code/opi/vsum.c 


1 void vsumiíint п} 

à Í 

3 int i; 

d 

5 for (1 = Ü; 1 < n; i++? 
s c[i1] = afi] + bli]; 
1 | 

Š 
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9 /* Sum vector of n elements (n must be even) */ 
10 void vsumž iint n) 


1l i 

12 int 1; 

13 

14 tor (1 = D; 1 < n; 1«-2] Í 

15 /* Compute two elements per iteration */ 
16 c[i] = a[i] + bli]; 

17 c[1+1] = а[1+1] + Б[1+1]; 

18 } 

19 | 


code/opt/vsum.c 


图 5.1 EJE KRISSY 
ЗЕ ХӘН ТИСЕ ИН, 


1000 --- --- 
900 
800 -一 一 
vsuml 7 NM 
700 +-—————U Siopa = 4. ———— 
Ж 500 у”, 
n . Vv eum 
HE 500 о, Slope = 3.5 
400 - 
T" 
=“ ' 
300 一 -一 一 一 一 一 一 
200 
Кы 
190 
0 
Ü 5ü 100 150 200 
元 素数 


5.2 向 量 求 和 函数 的 性 能 
B Zk НДЕ ЖОНИНЕ л. ЖДД (CPE). 
$i. ТАЕЖЕ? 

FT ARREO, y) xs xoi es ЖАПЖАШ S AA, ВАНТ ЕКА 
的 趋势 . AE zx, TSK ita y=m +b 65, ӘЛТЕЗЛАЖАЖАЫР: 
E(mb) = ) (mx; +b- y) 
і=1.л 


"Я m b Еи) Em, b) €-T- m fe b 6 АВН Ж. 


练习 题 5.2 
在 本 草 后 面 ， 我 们 会 采用 一 个 函数 ， 生 成 许多 和 不同 的 变种 ， 这 些 变种 保持 函数 的 行为 ， 又 具有 
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不 同 的 性 能 特性 。 对 于 其 中 三 沾 变 种 ， 我 们 发 现 运行 时 间 【 用 时 钟 周 期 表示 ) 可 以 用 下 面 的 函数 近 
局 地 居 计 : 

版 本 60435n 

版 本 2 136+4п 

版 本 3 157+1,25n 

每 个 版 本 在 nn 取 什 么 值 时 是 三 个 版 本 中 最 快 的 ? 记 住 ,i 总 是 整 教 ， 


5.3 ”程序 示例 


为 了 说 明 一 个 抽象 的 程序 是 如何 被 系统 地 转换 成 更 有 效 的 代码 的 ， 考 处 图 5.3 所 示 的 简单 向量 
数据 结构 。 问 量 由 跑 个 存储 器 块 表 小 。 头 部 是 一 个 声明 如 下 的 结构 ; 


code/opt/vec.h 
1 У Create abstract data type for vector */ 
2 typedel struct { 
3 int len; 
4 data t *data; 
5 % vec rec, *vec ptr; 
code/om/vec.h 


0 12 length-t 
TIT [I] 


图 5.3 向 量 的 抽象 数据 类 型 
ЈА] & i 34590 ЇЧ ЕЛЕНДІ Ж R. 
这 个 声明 用 数据 类 型 data t 作为 基本 元 束 的 数据 类 型 。 在 我 们 的 评价 中 ， 我 们 彰 量 我 们 的 代码 
对 于 数据 类型 int. float 和 double 的 性 能 。 为 此 ， 我 们 会 分 别 汶 不 同 的 类 型 声明 编译 和 运行 程序 ， 
typedeí int data t; 


除了 头 以 外 ， 我 们 还 会 分 也 一 个 len 个 data 类 型 对 象 的 数组 ， 来 存放 实际 的 向 量 元 素 。 

图 5.4 给 出 的 是 一 些 生成 癌 量 、 访 占 站 量 元 素 以 及 确定 问 基 长度 的 基本 过 程 。 一 个 值得 注意 的 
ш РЕЛЕ get_vec_element， 向 量 访 划 程序 会 对 每 个 问 量 引 用 进行 边界 检查 。 这 段 代 码 类 似 于 许多 
HRES Efi Java) 所 使 用 的 数组 表示 法 。 边 界 检查 降低 了 程序 出 错 的 机 率 ， 但 是 正如 我 们 看 到 
ВЕ, БЕЕН а и ЕЕЕ ВЕ. 

Пі, ЗЕ 5.5 中 所 小 的 代码 ， 它 根据 某 种 运算 ， 将 - -个 向 量 中 所 有 的 元 素 合 
并 Combining? Е “А, 通过 使 用 编 详 时 常数 DENT 和 OPER HARE BIARIN EH 
埋 成 对 数据 执行 不 同 的 运算 。 特 别 她 ， 使 用 声明 ， 

ЯлеГіле IDENT 0 

#define OPER + 


号 对 向 量 的 元 素 求 和 。 使 用 声明 : 


*tdefine IDENT 1 


328 # 5% 


fdefine OPER * 

ИИ AEGAN., 

作为 一 个 起 点 ， 下 面 是 combinel 的 CPE 虐 量 值 ， 它 运行 本 Intel PentiumlII Б, 2514 f Eg 
ЖЯ ЖЕЛЕ PH Ше. (FII ИН. WIESE. MARG а СААН В F e AHS 
E. АҢ, АУБГА Н ЫНЫҢ, 





Combinel 320 ЖИЛЕ mm | 41.86 . 160.00 
Combinel 329 HA ti-o? 31.25 33.25 31.25 143.00 


code/opt/vec.c 


1 f*Üreate vector of specified length */ 

2 vec ptr лем vecíint Теп) 

É l 

4 /* allocate header structure */ 

5 vec ptr result = чес ptr] maliocísizeotfí(vec гес) }; 
É 1Ё (!result) 

7 return NULL; /* Couldn' t allocate storage */ 

> result->len = ler; 


9 /ж Allocate array */ 

19 if ilen > 0) í 

11 data t *data = [data t *)callocilen, вігеоі даға t!); 
12 1f ('data) { 

13 free((void *) result): 

14 return NULL; /* Couldn' tallocate storage */ 
15 | 

16 reslilt-»data = data: 

17 } 

18 е se 

19 result-»data = NULL; 

20 return result; 

21 } 

22 

23 у 


24 * Retrieve vector element and store at dest. 

25 * Return Ü (out of bounds) or ! (successful) 

26 */ 

2/7 int get vec elementívec ptr v, int index, data t *dest) 
28 | 


29 if (index < 0 || index >= v-»len) 
30 return Ü; 

31 *dest = v-»gata[index]: 

32 return 1; 

i3  ] 

34 


35  /* Return length of vector */ 


优化 程序 性 能 329 


36 int vec length(vec ptr v) 


37 { 
iH returr v-»len; 
39 ) 


code/opt/vee.c 


54 ТЗН Nm 
在 实际 程序 中 ， 数 据 类 型 data 1 Ж; Jg nt. float 或 double, 


code/opt/Vcombine.c 


1 /*Implementation with maximum use of data abstraction */ 
À void cembineiivec ptr v, data t *üdest) 

3 { 

4 іпЕ 1; 

5 

Б *dest = IDENT: 

7 for [1 = D; i < vec length(v); i++) Í 
8 data t val; 

9 дег vec elemenLtiv, i, Val); 

10 test = *dest ОРЕК val; 

11 } 

12 } 


сойєѓорисотінце.с 


55 合并 操作 的 初始 实现 
使 用 标识 元 素 DENT 利 合 并 运算 OPER ЖЕРІН, RIUS U BIB iZ Е W PRE, 


ТАНА, р йт THO SAB uk Ub 一 步调 试 的 代码。 因为 日 的 是 使 日 标 代码 尽 可 能 
类 似 于 源 代码 中 表明 的 计算 ， 所 以 几 平 没有 进行 什么 优化 。 简 单 地 将 命令 行 开关 设置 为 “-O2”， R 
们 克 能 进行 优化 了 。 正 如 看 到 的 那样 ， 这 显著 地 提高 了 程序 性 能 。 通常 ， 养 成 进行 这 一 级 优化 的 习 
惯 是 很 寻 的 ， 际 非 编 详 程 序 威 是 为 了 可 调 试 它 。 对 于 我 们 剩 下 的 度量 ,我们 都 进行 了 这 一 级 别 的 纺 
ари, 

EEFE, ER T P ЖЕДИ, ATARI ЕЖЕН ИУ ЕПН ЖЖ Аре ЈАЈА АЈ, W 
KARRA IR ЕЛЕЕ Е Се а Р АТО PF ТК. ЕН РЕОН ЕНЕ ЕИ, 
化 的 一 个 重要 组 成 部 分 。 我 们 会 在 5.11.1 节 中 间 过 来 讨论 这 个 问题 。 我 们 会 看 到 可 以 大 幅度 地 提高 
T RITE RE o 


54 消除 循环 的 低 效率 


可 以 观察 到 ， 过 程 combinel 调用 国 数 vec, length РЕЈ for fi& 9 Ir) Nj iA АН, ШЕ 5.5 Боқ. B 
想 - 下 我 亿 对 逢 环 购 讨 论 ， 每 次 循环 选 代 时 都 必须 对 测试 条 件 求 值 。 另 - JW, ӘНМЕН 
随 独 箱 环 的 进行 而 改变 ， 因 此 ， 我 们 只 需 计 算 一 次 向 量 的 长 度 ， 然 后 在 我 信 的 铀 试 条 什 中 使 用 这 个 
fü. 


图 5.6 erit] e ЧЕЛЕК, ЖА combiae2.. EET ASIN Н vec_length， 并 将 结果 赋值 


330 %5% 


给 局 部 变革 length. Б, ЯҒ for 循环 的 测试 条 件 中 使 用 这 个 局 部 变量 。 令 人 惊 育 的 基 ， 这 个 小 小 的 
改动 明显 风 影 珊 了 程序 性 能 。 如 下 表 所 示 ， 通 过 这 个 简单 的 变换 ， 我 们 为 每 个 向 最 元 素 消 除 人 概 
10 个 时 钟 周期 。 


Sa |, 585 
+ + 
союр1ле1] 329 抽象 的 -局 2 31.25 33.25 31.25 143.00 
combine2 330 | ЖАЗ vec length 22-61 2125 21.15 135.00 
图 56 改进 循环 测试 的 效率 
HEE vec length RJ BHI H ЕЙ. ЭПТЕ SERERE PER EE АЖ Г. 












9 7? code/opt/combine.c 
/* Move call to vec length out of loop */ 


] 

2 void combine2(vec ptr v, data L *dest) 
3 { 

4 int i; 

5 int length = vec_length(v); 

5 

7 *dest - IDENT; 

H -or 41 = D; 1 < length; i++} Í 

3 data t val; 

10 get vec e ement iv, i, &val); 
11 *dest = *dest OPER val; 

12 } 

13 | 


тал а —“їЄє=єт 
— h ra—........................................................................ 


code/opt/combine.e 


这 个 优化 是 ARMS. ЖАҚ) (code motion) Ie Ed: B. xx OB FE ELS p ЖЕҢ, 
行 多 次 (例如 ， 在 循环 里 ) 但 是 计算 结果 不 会 改变 的 计算 ， 因 而 我 们 可 以 将 计算 移动 到 代码 前 面 的 ， 
不 空 被 多 侈 求 值 的 部 分 。 在 本 倒 中 ， 我 们 将 对 vec length 的 调用 从 循 坏 内 部 移动 到 循环 的 前 血 。 

优化 编译 器 会 试 戎 进行 代码 移动 。 不 幸 的 是 ， 就 像 前 面 讨论 过 的 孝 样 ， 对 于 会 改变 在 哪 早 调用 
六 数 成 调用 多 少 次 的 变换 , 编译 器 通常 会 目 常 小 心 。 它们 不 能 订 靠 地 发 现 -个 函数 是 否 会 有 副作用 ， 
加 而 它们 会 假设 区 数 会 有 副作用 . 例如， 如 果 vec lengih ЕЦЕ, ЯА combinel 和 combine? 
可 能 吻 会 有 不 同 的 行为 。 在 这 样 的 情况 中 ， 程 序 员 必须 帮助 编 详 器 显 式 地 完成 亿 反 的 移动 ， 

作为 combine] 中 看 到 的 笛 环 低 效率 的 - -个 极端 例子 ， 考 虑 图 5.7 中 所 未 的 过 程 jowerl。 这 个 过 
竺 坪 和 梧 仿 儿 个 学 生 的 痢 数 设计 ， 他 们 的 秀 数 是 作为 一 个 网 络 编程 项 目的 一 部 分 提 变 的 。 这 个 过 程 的 
日 的 乓 将 一 个 字符 从 中 所 有 大 与 宁 母 转换 成 小 写字 每 。 这 个 过 程 一 步 БИЕ И. ЖЕТА 
与 宁 符 转换 成 小 汝 字符。 


м 


code/opt/lower.c 
1 Ж Convert string to lower case: slow */ 


2 void lowerl(char *s! 
3 { 
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int i; 


4 

5 

6 for (i = 0; ` < strlenís); i++) 

7 if (s[il >= "А! && 5[1] <= '®'} 
9 s[i] -= ('A' - 'а'); 

9 


) 


11  f* Convert string to lower case: faster */ 
12 void lower2ichar *s) 

13 í 

14 int 1; 

15 int len - strlenis); 


17 for {i = 0; 1 < len; i++) 

|Р if (ЕНІ >= 'A' && s[i] <= 'Z') 
15 s[i] -= ('A' - 'a'); 

20 ) 


22 Ппретенайол of library function strlen */ 
23 У Compute length of string */ 
24 size t strleníconst char *s! 


25 d 
2E int length = J; 
27 while ;*s із '\0'} 1 
2 Е Stt 
29 length++; 
% ї 
31 return length; 
32.1 
coüe/opvlawer.c 
图 5.7 小 写字 母 转换 函数 
ЖТИ ВЕЗЕ АА. 


调用 库 过 程 strlen (Е Jj lowerl 的 循环 测试 的 一 部 分 。 图 5.7 中 也 给 出 了 strlen 的 一 个 简单 的 版 本 。 
因为 5 中 字符 串 是 以 null 结尾 的 字符 序列 ，strlen 必须 一 步 一 步 地 检查 这 个 序列 ， 上 由 到 滑 到 пш = 
行 。 对 于 一 个 长 度 为 £4 НЕРВ, яшел 所 用 的 时 间 与 成 正比。 因为 对 lower Кл 次 迭代 的 每 一 
(X fiber UH] strlen, PATEL lower) 的 整体 运行 时 间 是 字符 串 长 度 的 二 次 项 。 
如 图 5.8 所 示 ， 这 个 过 程 对 各 种 长 度 的 字符 串 的 实际 测量 值 验证 了 上 述 分 析 。lowerl 的 运行 时 
间 上 曲线 图 随 着 字符 串 长 度 的 增加 上 升 得 很 陡峭 。 该 图 的 下 部 展示 了 八 个 不 同 长 度 字 符 串 的 运行 时 间 
(与 曲线 图 中 所 示 的 有 所 不 同 )， 每 个 长 度 都 是 2 MRR. TUAS, ЕР lowerl 来 说 ， 字 符 串 
长 虚 每 增加 一 倍 ， 运 行 时 间 都 会 变 为 原来 的 四 人 悦 。 这 很 明显 地 表明 复杂 度 是 二 次 的 。 对 于 一 个 长 度 
^J 262144 的 字符 串 ，lowerl 需要 整整 3.1 分 钟 CPU 时 间 ， 
除了 我 们 把 对 strlen 的 调用 移出 了 循环 以 外 ， 图 5.7 FARA Jower2 与 lowerl 是 一 样 的 。 这 样 
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一 来 ,性 能 有 了 显著 改善 .对 于 一 个 长 度 为 262144 的 字符 串 , АЯН ЕШ 0,006 2-І Iowerl 
Г 30000 多 倍 。 字 符 串 民 度 每 增加 一 倍 ， 运 行 对 间 也 会 增加 一 售 一 -很 显然 复杂 虚 是 线性 的 。 对 
ТЕКТЕ. РНН е А. 

КЕЈН, РЕВА БИШ strlen ЁК} КАЕ А ЕЕ ШЕЕ E, REN 
沪 能 够 把 这 个 调用 移出 循 永 。 这 需 昌 非常 成 熟 完善 的 分 析 ， 因 为 strlen 2 ЕВ ДЖ. ШШ 
者 lowerl 内 进 行 ， 这 些 值 会 收 变 。 编 详 器 需要 探查 ， 妈 使 字符 串 中 的 字符 发 生 了 改变 ， 们 是 没有 字 
TP eMdEXGEAS, MERK МЗ ЗЕ. 这 样 的 分 析 远 远 超 出 了 坏 使 是 最 有 野心 的 编译 册 
拘 能力， 所 以 程序 员 必 须 自 己 进行 这 样 的 变换 。 





.OwBII 


ісшшег? 





0 50,000 100.000 150,000 200,000 250,000 
FARER 


65 536 . AL O72 
lowerl . 12.75 51.01 
lower? ‚ 0.0016 6.0031 
658 小 与 字母 转换 函数 的 性 能 比较 
ELTE ES fad ЖЕЙК. IE] lowed 的 代码 共有 .次 渐 近 (asyimptolic) ЖЛЕ. ЕРІНІН ower 的 代码 有 线性 的 复杂 度 ， 


这 个 小 例 说 明了 编程 时 一 个 常见 的 问题 ， 一 个 看 上- 去 尤 足 轻重 的 代码 片断 有 隐藏 的 浙 近 低 就 率 
(asymptotic inefficiency), АЯ] a] 435 28 —4 3 BERE ТА ЖЕЛ FEE ERE T ЕЗІ Ж. 11, 
会 化 小 数据 集 上 测试 和 分 析 程 序 ， 对 此 ，loweri Б ЕЕЕ. Жы, ЗАТ, 
Чел ЕН НЕ ЛУН] AA 100 万 个 空 符 的 串 上 ， 对 此 ，lowerl 从 类 至 尾 会 需 旨 个 小 时 的 CPU 
有 时间。 突然 ， 这 段 无 和 荡 险 的 代码 变 成 了 个 主要 的 性 能 瓶 须 。 相 比较 而 言 ，Jower2 会 在 1 秒 之 内 究 
成 。 人 型 编程 项 目 中 会 出 下 这 样 的 问题 ， 这 样 的 故事 刺 比 氏 是 。 一 个 有 经 验 的 程序 员 作 的 一 部 分 
ЖЖЖ АЕТ ОПЕЕ. 


练习 是 5.3 
考虑 直面 的 函数 ， 


int miníint x, int y) í return X < y ? x: yr ) 
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int max(int x, int y) í return X < y ? y : x; ] 
void incrí(int *xp, int v) í *xp += v: ) 
int square(int x) { return x*x; ] 


下 面 三 个 代码 片断 调用 这 些 函 教 ， 


А. for (i = пігіх, ү); i < пахіх, y); incrí&i, 1)) 
t += square[i); 

B. fcr (i = max(x, y) - l; i >= minix, y); incr(&i, -1)) 
t += square(l); 

C. irt low = min(x, у); 


int high = maxíx, y): 


for íi = low; 1 < high; іпсгікі, 1)) 
t += S8quareli); 


Бх 等 于 10, 而 y SET 100. RETE, 指出 在 代码 片断 A~C ЛА Ak ТӨЛЕН CR 





5.5 减少 过 程 调用 


像 我 们 看 到 过 的 那样 ， 过 程 调 用 会 带 来 相当 大 的 开销 ， 而 且 妨 得 大 多 数 形式 的 程序 优化 ， 从 
combine? [UR CHE 5.6) PROJE BH., FRAMERS РН get vec element 来 获取 于 一 个 
阿 量 元 素 。 这 个 过 程 开 销 特 别 大 ， 因 为 它 要 进行 边界 检查 。 在 处 理 任 意 的 数组 访问 时 ， 边 界 检查 可 
HEX TUBE ERBEN TE, EX combine? 的 代码 稻 简 单 的 分 析 ， 表 明 所 有 的 引用 都 是 可 以 避免 的 。 

作为 普 代 ， 我 们 假设 为 我 们 的 抽象 数据 类 型 增加 一 个 函数 get vec. start. XX ОБ ERAR 
igual, ШЕ 5.9 所 未 。 然 后 我 们 就 能 写 出 此 图 中 combine3 所 示 的 过 程 ， 其 中 的 循环 里 没有 函数 
АН. 它 没 有 上 诈 函 数 调用 来 获取 每 个 向 量 元 素 ， 而 是 真 接 访 问 数 组 。 一 个 纯粹 主义 者 可 能 会 说 这 种 
变换 严重 地 摊 害 了 程序 的 模块 性 。 通 常 ， 向 量 抽 象 数据 类 型 的 使 用 者 其 至 不 应 该 需要 知道 向 量 的 内 
容 是 作为 数组 来 存储 的 ， 而 不 是 作为 诸如 链表 之 类 的 某 种 其 他 数据 结构 来 在 楼 的 。 比 较 实 慰 的 程序 
员 会 根据 下 面 的 实验 结果 ， 说 明 这 种 变换 的 优点 : 


[x4 Domo 
330 | Әуес length 20.66 зы: 15 — 1354 
334 ERN Vg 6.0 117.00 


1 data t *get vec startí(vec ptr v) 
2 [ 















combine2 


combinei 


code/opyvec.c 








3 return v->data; 
4 | 
ME code/opt/vec.c 
-- code/opt/combine.c 
1 /* Direct access to vector data */ 
2 void combineií(vec ptr v, data t *dest) 
3 | 
4 int 1; 
y int length = vec lengthív); 
5 data t *data = get vec start lv}; 
j 
H кде = TDENT: 
9 tor [i = 0; 1 < length; i++) 1 
10 *dest = *dest OPER Gatalil; 
11 ) 
12 | 


code/opt/combine.c 


图 5.9 消除 循环 中 的 函数 调用 
ннен, ымш ват тиын X CUN MS. 


改进 最 高 可 以 达到 3.5Х. ХРНЕЯХЕЕНЕН Ж, A TRR, ERGO TUR — t IN 
ЖАН. ИЯ ЕБ ҚЫНА, SL ESI PLSEHL EF EG ORE ЖЕРДЕН HERI 


mu. Ж ЛАА 

+ T fe PCIE ЖОНИ ЙА Н Told/Tnew 的 比率 ,这 里 Told 是 原始 版 本 所 需 的 时 间 , 而 Tnew 
是 收 政 过 的 版 本 所 需 的 时 间 。 如 时 发 生 了 实际 的 政 进 ， 它 应 这 是 一 个 大 于 1.0 BET, ADR ER 
“W” 来 表示 这 样 一 种 上 比率， 因子 “3.5X” 读 作 “3.5 87, 

更 加 传统 的 表示 四 财 变 化 的 方法 是 百分比 ， 在 变化 很 小 时 ， 还 是 很 有 效 的 ， 但 是 它 的 定义 十 分 
AM. CARA 100-(Т0/4-Тлем) пече, 124 100-«(Told- TnewyToid, АЛЕН AR? wth, Ж 


кх, TETELA НЫТ. X; “i kati T 250%” НЕНАНЕЯЛАТ» 35 3 308 
以 理解 一 些 ， 


56 消除 不 必要 的 存储 器 引用 


combine3 的 代 咎 将 合并 控 作 计算 的 值 皖 积 在 指针 desi 指定 的 位 置 , 通过 检查 被 编 详 的 循环 产 汪 
的 汇编 代 他， 整数 作为 数 蜂 类 型 ， 乘 法 作为 合并 操作 ， 可 以 看 出 这 全 晶 忻 ， 杏 这 段 代码 中 ， 寄 存 跨 
Фесх 181 data, %edx 8 i 018, ІП wedi 15 [H] dest, 


combing3: type-INT, ОРЕК = + 
dest in edi, data in Фесх, i in Фейх, length in fesi 


d .L18: loop: 

2 movl (Жейі!,%сах Read *dest 

3 imull í($ecx,*edx,4),$eax Multiply by data[i] 
4 movl Феах, [%edi) Write "desi 

5 incl *edx i++ 
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6 cmpl %еБі,Фейх Compare i:length 

L jl .118 H «, goto loop 

指令 2 读 取 存 放 在 dest 中 的 值 ， 指 令 4 写 回 这 个 位 置 。 这 看 上 去 是 种 浪费 ， 因 为 正常 情况 下 ， 
下 -一次 迁 代 时 指令 2 起 取 的 值 会 是 刚刚 写 回 的 那个 值 。 

这 就 导致 了 图 5.J0 中 combines 所 加 的 优化 ， 丰 这里， 我 们 引入 了 一 个 临时 变量 x， 它 用 在 循环 
中 存放 计算 出 来 的 值 。 只 有 在 循环 完成 之 后 结果 才 存 放 在 *dest H., 正如 下 面 的 汇编 代码 所 示 ， 编 译 器 
Я АИ езх т SUBE. 5 combine3 的 循环 相 比 ， 我 们 将 每 次 迭代 的 存储 器 操作 从 两 次 
读 和 一 饮 己 减少 到 内 需要 一 次 读 。 寄 存 器 和 ecx 和 %edx 的 使 用 和 前 面 一 样 ， 但 是 不 再 需要 引用 *dest。 


combined: typezINT, ОРЕК = + 
data in %еах, x іп %есх, i in Фейх, length in wesi 








1 „124: loop: 
2 imull (%Жеах,%едх,4),%есх Multiply x by data[i] 
3 incl Фейх i++ 
4 cmpl $esi,&edx Compare i:eneth 
5 11 .L24 If <, goto loop 
code/opt/comhine.c 
1 /* Accumulate result in local variable */ 
2 void combined4(vec ptr v, data t *dest| 
3 { 
4 int i: 
5 іп” length = vec length(wv); 
5 Пата t *data = get vec startí(v): 
7 Паса t x = IDENT; 
2 
Q *dest = IDENT; 
10 tor (i = 0; 1 < length; i++) { 
11 x = x OPER data[il; 
12 } 
1. "dest = X; 
14 h 
code/opt/combine.c 


图 510 ЖЕНЕ 
LUCR EXC HE QUI WS. 


ТІГЕТІН 


法 





combinej3 直接 数据 访问 
combine4 RIS E Eh 


FERRIERS RARR. ТКЕН ӘНЕ ЕНІНЕН О ААН НАЈ АТ НЕ 
了 。 我 们 会 在 5.11.1 小 节 中 检查 这 种 迅速 下 降 的 应 因 ， 
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| BE ЖН А.ж V АЙЕ EE g DV. TA Be 5 Н 3738 [5.9 中 所 示 的 combine3 的 代码 转换 为 在 寄存 器 中 让 
WA d. ӘЛЕН 5.10 IP PIT] combined HAERA ATARI XS FE 

Wesce E. НЕЕ ESTER]. PISCIBUS HIA. win. Xr. 
AW ANE. WELA LAAN. v 是 一 个 由 三 个 元 素 [2, 3, ИРЕ, ЖЕКПЕ 
H: 


combine3ív, get vec start(v) + 2]; 
combinedí(v, деб vec start(v) + 2); 


taki. ЛИЕШ Т ToU REB АОН Б jJ EE. NEA. MARR RHA 


ІШ F: 






аа Ба Tama | es [ nr [ eR 
|2, 3, 5] [2. 3, 5] [2, 3, 5] [2,3,5] (2, 3, 30] 

1E hr aptis ЫЕ 9, combine3 ft EU 5 dr EH RS CAAP, НАА ШИ E: nj E 89 
ЕЛІ DIE. BG. WK 8 P RIBA I, ЖБЫЖ2-1-2, Xni 3.226. В) — 01 
代 中 ， 这 个 值 会 乘 以 它 白 己 ， 得 到 最 后 结果 36。 对 于 combined HREH, RARA ba ДИФ 
个 滨 ， 结 束 之 前 ， 最 后 一 个 元 素 会 被 设置 为 计算 出 来 的 值 1.2.3.5= 30, 

当然 ， ВИГО 19 combine3 和 combines 之 间 差 别 的 例子 是 入 为 设计 的 。 有 人 会 说 combined 的 行 
А h JI РА СНО Р. 不幸 的 是 ， 优 化 编译 器 不 能 判断 函数 会 在 什么 情况 下 被 调用 ， 以 点 各 
序 员 的 本 意 可 能 是 慎 么 。 取 击 代 之 的 是 ， 在 编译 combine3 时 ， 编 译 器 有 责任 保持 它 和 的 与 能 ， 即 使 这 
党 味 者 生成 低 人 效率 的 代码 ， 






combirez (2,3,5 
Ста [2 3, 5] 






5.7 ”理解 现代 处 理 器 


到 日 而 为 止 ， 我 们 运用 的 优化 都 不 依赖 十- 目标 机 器 的 任何 特性 。 这 些 优 化 只 是 简单 地 降低 了 过 
和 网 凡是 并 销 ， 以 及 消除 了 一 些 重 大 的 “妨碍 优化 的 因素 ”这些 财 素 会 给 优化 编 详 器 造成 困难 。 崩 
埋 我 们 试图 进步 提 癌 性 能 ， 我 们 必须 开始 考虑 这 样 的 优化 ， 它 们 更 多 地 利用 处 理 器 执行 指令 的 方 
式 和 某 些 处 理 器 的 能 尹 。 竖 想 获得 最 大 的 性 能 ， 需 要 仔细 地 分 析 程序 ， 问 时 代码 的 后 成 也 要 针对 日 
杯 处 理 嚣 进行 调整 ,尽管 如 此 ， 我 们 还 是 能 够 运用 一 些 基本 的 优化 ， 在 很 大 RER e ER 
的 性 能 提 癌 。 我 们 在 这 里 公布 的 详细 性 能 结果 ， 对 其 他 机 器 不 一 定 也 有 同样 的 和 效果， 但 是 操作 和 优 
化 的 通用 原则 对 范围 众多 的 机 器 都 适用 ， 

久 了 理解 改进 性 能 的 方法 ， 我 们 需要 -个 关于 现代 处 由 器 是 如 何 工 作 的 简单 挑 作 模 型 。 册 十 大 
elan п 以 被 集成 到 “ 抉 世 片上 ， 需 代 微 处 理 器 采用 了 复杂 的 硬件 ， 试 图 使 程序 性 能 最 大 化 ， 
一 个 万 呆 就 是 处 理 右 的 实际 操作 与 规 察 汇编 语言 程序 得 到 的 概念 人 相 名 庭 ， 在 汇编 代 代 级 ， 看 上 走 
似乎 是 “次 执行 -条 指令 ， 每 条 指令 者 包括 从 寄存 器 或 存储 器 取 值 ， 执 行 -个 操作 ， 并 把 结果 存 回 
到 个 寄存 器 或 由 储 器 位 置 。 在 实 奈 的 处 理 器 中 ， 是 同时 对 多 条 指令 求 值 的 。 在 某 些 设计 中 ， 订 以 
H S0 或 更 多 条 指令 在 处 理 中 。 采用 些 精细 的 机 制 来 确保 这 种 并 行 执行 的 行为 , 能 正好 获得 机 器 级 
程序 里 求 的 顺序 语义 模型 的 效果 。 
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5.71 整体 操作 

图 5.11 给 出 了 现代 微 处 理 器 的 一 个 非常 简单 化 移 示 意图 。 我 们 假设 的 处 香 器 而 计 是 基于 Intel 
“P6” 微 体系 结构 的 [30], ЖА А Ж Intel PentiumPro、Pentium П 和 Pentium HI ЖЖ 
础 。 较 新 的 Pentium 4 的 微 笨 系 结构 有 节 不 同 ， 不 过 已 更 整体 结构 与 我 们 在 这 明 讲 述 的 很 类 羽 。P6 
ПАМА Н 20 世纪 0 年 代 后 期 以 来 许 名 厂商 和 牛 产 的 高 端 处 理 器 移 上 典型。 在 工业 寞 称 为 超标 量 
Csuperscalar)， 意 忆 是 它 可 以 存 每 个 时 钟 周期 执行 多 个 操作 ,而 内 是 乱 订 的 《out-of-order)， 意思 就 
是 指令 执行 的 顺序 不 一 定 要 与 它们 在 汇编 程序 中 的 了 顺 序 一 致 。 整 个 设计 有 两 个 证 要 部 分 ICU 
(Instruction Control Unit, 484-j€ 5] € 5,2 I EU (Execution Unit， 热 行 单元 )。 有 者 负责 从 仔 储 器 
中 读 出 指令 序列 ， 并 根据 这 些 撒 令 序 列 生 成 一 组 针对 程序 数据 的 基本 操作 ， 而 后 者 执行 这 些 操 必 。 





511 一 个 现代 处 理 器 的 框图 
指令 抬 制 单元 负责 从 存 情 器 中 读 出 指令 ， 并 产生 - 系列 基本 操作 。 然 后 执行 单元 完成 这 些 操作 ， 以 芒 指 出 分 支 顶 测 是 知 正 确 。 


ICU Аа 39 3E Я (instruction cache) 中 读 取 指 令 ， 指 令 高 速 缓存 是 一 个 特殊 的 蜗 速 缓存 
个 情 器 ， 它 包含 最 近 访 问 的 指令 。 通常，ICU 会 在 当前 正在 执行 的 指令 很 早 之 前 到 指 ， 所 以 它 有 
足够 的 时 间 对 指令 解码 ， 并 把 握 作 发 送 到 EU。 不过， 有 一 个 问题 ， 那 就 是 当 程 序 遇 到 分 支 hi 


1 我 们 用 术 语 “ 分 支 ” 专 指 条 忻 苇 称 指 令 。 对 处 理 器 来 说 ， 范 他 巨 能 将 控制 传送 到 多 个 目的 地 址 的 指令 ， 例 如 过 程 返 加 和 间 
扶 肛 转 ， 处 理 起 来 的 困难 程度 是 类 羽 的 。 
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B PF NE ТЕЙ ИП y. арава, БШШШ Л УЕН. F прве, Ж 
ЖЛЕ Ж. СОДАН ЭЕЛІКТ-ЖІН2. {ЛАШ ЖН ARIA EA (branch 
prediction). 的 技术 ， 在 这 种 技术 中 处 理 器 会 预测 是 否 选择 分 克 ， 同 时 还 预测 分 支 的 日 标 地 址 。 使 
Hi 一 种 栎 为 投机 执行 (speculative execution) 的 技术 ， 处 夫 器 会 开始 取出 它 预 测 的 分 支 处 的 指令 
半 对 可 令 解码 ， 甚 至 于 在 它 确定 分 云 参 测 是 否 正 确 之 前 就 开始 执行 这 些 操作 。 如 果 过 后 它 确 定 分 
六 现 测 错误 ， 它 会 将 状态 重新 没 置 到 分 支 入 区 状态 ， 并 开始 取出 和 执行 男 一 个 方向 上 的 指令 。 一 
种 吏 器 异乎 性 常 的 技术 是 开始 取出 和 执行 两 个 可 能 方向 上 的 指令 ， 随 后 表 抛 弃 掉 不 止 确 方向 上 的 
绽 示 ， 时 至 分 日 ， 虱 个 认为 这 种 方法 的 成 本 效率 是 值得 的 。 标 号 为 取 指 控制 的 块 包括 分 支 逢 测 ， 
以 完成 确定 取 哇 条 指令 的 任务 ， 

指令 解码 逻 铀 接收 实际 的 程序 指令 ， 并 将 它们 转换 成 -组 基本 操作 。 每 个 操作 都 完成 某 个 简单 
的 中 好 什 务 ， 例 如 两 个 数 相 加 ， 从 存储 器 中 读数 据 ， 战 是 向 存储 器 写 数 据 。 对 具有 复杂 指令 的 机 
йй, ЖИНА ТАЗ2 处 理 器 ， 可 能 将 一 条 指令 解码 成 可 变数 量 的 操作 。 每 个 处 昕 器 设计 的 详细 情况 
部 有 所 不 网， 得 是 我 位 试 着 撕 述 一 种 典型 的 实现 。 在 这 种 机 器 上 ， 解 码 卜 面 这 个 指令 

addl €eax, %есх 
产生 一 个 加 法 操作 ， 而 解码 下 面 这 个 指令 

аса! %еах, 4 (%едх) 


产 皇 二 个 操作 一 一 个 操作 从 存 情 器 中 加 载 一 个 值 到 处 理 器 中 ， 一 个 操作 将 吉 载 进来 的 第 加 上 寄存 
fi %еах 中 的 人 ,向 一 个 操作 将 结果 丰富 到 存 储 器 ,。 这 种 解码 逻辑 分 解 指令 的 操作 ,实现 了 在 -组 专 
门 的 硬件 单元 之 间 的 任务 分 着 。 然后， 这 些 单元 可 以 并 行 地 执行 乘法 指令 的 务 个 部 分 。 对 于 具有 简 
第 指令 的 机 器 ， 操 作 和 更 紧密 地 对 应 于 原始 的 指令 ， 

EU 接收 来 月 指令 读 取 单元 的 操作 。 通 常 ， 它 会 每 个 时 钟 周期 接收 若 十 个 操作 。 这些 措 作 会 补 
分 小 到 组 功能 单元 中 ， 它 们 会 执行 实际 的 操作 。 这 些 功 能 单元 是 专门 用 来 处 理 特 定 类 卉 的 操作 ， 
RURA GEA 5.11) ЕТ -组 典型 的 功能 单元 。 它 沿用 的 是 最 近 的 Intel 处 于 由 的 风格 。 图 中 的 
单元 如 下 ; 

驻 数 /分 支 ， 执行 简单 的 整数 操作 加法、 测试 、 比 较 、 逻 辑 )。 还 处 理 分 支 ， 就 像 下面 全 讨论 
m ДИ. 

HEN. 可 以 处 由 所 有 的 整数 操作 ， 包 括 磁 法 和 除法 。 

FAMY: 处 娃 简 单 的 浮 点 操作 【加 法 ， 格 趟 转 换 )。 

浮 点 习 法 /除法 :处 理 浮 点 乘法 和 中 法。 更 复 休 的 浮 点 指令 ， 例 如 超越 后 数 transcendental 
fnction)， 会 被 转换 成 操作 的 序列 。 

加 载 : 处 理 从 存储 器 读数 据 到 处 理 器 的 操作 ， 这 个 功能 单元 有 : -个 加 法 器 来 执行 地 址 计算 。 

fMi. 处 理 从 处 理 器 到 存储 器 的 写 操作 。 这 个 功能 单元 有 -…- 个 加 法 器 来 执行 地 址 计算 。 

型 图 中 所 示 ， 加 载 和 存储 单元 通过 数据 高 速 缓存 访问 存储 器 ， 这 是 一 个 高 速 存 情 器 ， 包 含 最 近 
访问 的 数据 值 。 

使 用 投机 快 行 技术 ， 对 操作 求 值 ， 介 是 最 终结 果 不 会 存放 在 程序 寡 存 器 或 数据 存储 器 中 ， 直 到 
由 性 如 能 确定 应 该 实际 执行 这 些 指 令 。 分 支 操作 被 送 到 EU, ЖАЙТ ЗАЛЫН E, ШЕЕ 
分 文 预测 是 否 正 确 。 如 果 预 测 错误 ，EU 会 丢弃 分 支点 之 后 计算 出 来 的 结果 。 它 还 会 发 信号 给 分 支 
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5.72 功能 单元 的 性 能 

W] 5.12 提供 了 Imel Pentium II 的 一 些 基本 操作 的 性 能 ， 其 他 处理 咒 也 具有 这 样 的 计时 特 古 。 竹 
THBEPE IS ЕШ ТЩ ЖИН ЖИЙ: 一 个 是 杭 行 时 间 latency)， 它 指明 功能 单元 完成 操作 所 需 
去 的 总 周期 数 ， 男 一 个 是 发 射 时 间 (issue іше) ERAEN. Scr Bee app M NON. dA TM 
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BIOS А АЕ ТЕШ — БИЙ. UH. АМ. AEEA E E LETTER GUB TE RO ЛТ FL UL 
到 除法 和 其 他 复杂 操作 的 许多 小 周期 。 

正如 留 5.12 中 第 三 栏 所 小， 处 理 器 的 几 个 功能 单元 被 流 术 线 化 了 ， 这 意味 看 在 前 -一 个 操作 完成 
之 前 ， 它 们 就 可 以 开始 -个 新 的 操作 。 发 射 时 间 指 明 一 个 单元 的 连续 反 作 之 则 的 周期 数 。 侍 一 个 这 
水 线 化 的 单元 中 ， 发 射 时 间 比 执行 时 间 短 。 流 水 线 化 的 功能 单元 是 作为 一 系列 阶段 玉 实 境 的 ， 每 个 
阶段 完成 操作 的 - 部 分 。 例 如 ， 一 个 典型 的 洋 点 加 法 器 包含 个 阶段 ;一 个 阶段 处 理 指 数值 ， 一 个 
将 小 数 相 加 ， 而 - 个 四 会 五 入 计算 最 后 的 结果 。 娩 和 作 可 以 连续 地 通过 务 个 阶段 ， 而 不 是 等 待 一 个 操 
作 完 成 后 时 开始 下 一 个 。 只 有 当归 执行 的 操作 是 连续 的 、 妈 辑 上 独立 的 ， 才 能 运用 这 种 功能 。 正 如 
表明 的 那样 ， 大 多 数 单元 能 够 每 个 时 钟 周期 开始 一 个 新 的 操作 。 仪 有 的 例外 是 浮 点 科 法 器 种 琴 个 际 
iub. ЕЛА a OKIE EREL [n] e "PEE BET I. FUP ERA К СНК. 


整数 加 法 
ы ы dbi. 
整数 除法 


TE Ex Mni. 
(Р ЖЕН. 
(AB. 
WE MERETET) 
fj АЖАР) 





图 5.12 Pentium 出 算术 操作 的 性 能 
ЗАТЛАР -条 操作 网 呈 局 期 数 。 发 射 时 间 吉 示 连 续 的 、 和 独立 的 操作 之 间 的 周期 类 [来自 十 Intel 的 文献 >。 


н Е ИТ Е АОВ -系列 性 能 特性 的 切 能 单元 。 创 建 一 个 执行 时 间 利 成 发 射 时 间 坦 的 音 
CARRERE RAER TREME a RERE ERR RANA. AA EGA E, A 
于 这 些 单 元 ,只 有 有 限 的 空间 ,所 以 CPU И ЖЗ | ih P Dn ge Po i EEA B ERE, 
ЧОВНА ЕВЕ, ЗЕТІН ИТАЛ, ЖА ЕНИН Pig ХЕШ. d 
图 5.12 ЖИНИНЕ, Ж Pentium ШИ, ERRE, РАЛ RU MUA AS U, АЖ ЕЖЕ. 80 
КЖ КЕШЕГЕ АК C DL ЕН) ag ЕТИК ТЕЛЕН. — ЛУШ. АНТА. IQ Hos 
EA SEMA А ІНІН ARE era], [ЕКШЕ ЕТЕ ЕН. 


573 更 近 地 观 察 处 理 句 操作 

作为 分 析 在 现代 处 理 器 上 执行 的 机 器 级 程序 的 性 能 ， 我 们 提出 了 -种 更 详细 的 文本 表示 法 来 撒 
证 指 沪 解码 器 产生 的 操作 ， 还 有 一 种 加 形 化 的 表示 法 来 显示 荔 能 单元 对 操作 的 处 理 ， 这 疝 种 老 丰 法 
部 不 能 准确 地 表示 有 具 悼 的 、 现 实 的 处 理 器 的 实现 ， 它 们 是 简单 的 方法 ， 帮 助理 解 处 理 器 在 执行 程序 
时 能 够 如 何 利用 并 行 性 和 分 支 预测 ， 

和 将 指令 翻译 成 操作 

3/1833 combines (图 5.10) 来 说 明 我 们 的 表示 法 ， 它 是 到 上 日 前 为 止 我 们 最 快 代 码 鸭 水 例 。 我 
们 只 关注 德 环 执行 的 操作 ， 因 为 对 很 大 的 问 量 来 说 ， 这 是 性 能 的 决定 恬 困 素 。 我 们 考虑 整数 数据 以 
区 以 薪 法 和 加 法 作为 合并 操作 的 情况 。 使 用 乘法 的 循环 的 编译 代码 由 四 条 指令 组 成 . 在 这 个 代码 中 ， 
9:17 Феах Dif 18t] data, Фейх 保存 i, Фесх ЕТ х, П езі 保存 length: 
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combined: type-INT, ОРЕК = * 
data in Фғах, x in Фесх, i in %edx, length in Wesi 


1 ‚124: loop: 

2 17111 ‘$eax, $edx,d) focx Multiply x hv даа] 
3 incl Фейх [十 十 

4 cmpl Жеві,Федйх Compare i-length 

5 3l .L24 If «, goio loop 


RRALLA. TB p EIS AERE UTR BERE pu ЁЛ БЫШ. Ж- 
KERI, 等 于 0， 我 们 假定 的 机 器 会 发 射 下 面 的 操作 序列 ， 


24: 
inull (%gax,wkeadx, 4), kecx load |Жвах, wedx.D, 4) + t.l 
| imull t.1, Фес. б -e %ecx.1 
incl &edx incl €edx,lü —  $edx.l 
cmpl šesi,%edx cmpl fesi, %ejx.L1 — c.l 
jl .L24 31-бәкеп cc.1 | 


{ЕЗИП ЛЕ ФИ, ПЕН ТЕЗЕ С RRRS ЕШ BJ load 指令 ， 它 将 数据 从 
БЕІН. ТЖЕ ЕКЕ АНЕ РНН МЫЛ E RUE (operand label), ЖАБ ЖЗ 
(£88 38 ЕК ИК tJ PU r R. ШЕ, ЛЕ, ЖАР Фесх ІНІН 8-Фесх.0 标识 ， 
(ја, ҤНФесх.1 ЖД. ЖКМ МЕКЕ НА ӘНЕ ГЕ CERERI] PLE 3 tras xl: 
BERG. ПИА THRE tl, ЖА Т load 操作 读 取 的 、 传 送 到 imull 操作 的 值 ， 而 我 们 显 式 地 给 
出 了 操作 的 月 的 则 。 因 此 ， 一 对 换 作 

load (%сах, Фейх.0, 4) — t.1 

imull t.1, %есх.0 — tecx.1 
表明 ， 处 理 器 首先 执行 一 条 load ЖЕ, Ж еах БИН GT BRE TRA Т Л ЕЕЕ) 印 循环 开始 时 存 
放 在 %edx 中 的 忆 来 计算 地 址 。 这 会 产生 一 个 临时 值 ， 标 号 为 1。 然 后 ， 乘 法 拘 作 获 取 这 个 值 和 入 
Ж ЖН Фесх 的 值 ， 产 生 一 个 Wecx 的 新 值 。 正 如 这 个 例子 赔 明 的 那样 ， 夭 记 可 以 与 并 不 会 写 到 寄 
ТАУ rR BP BMS АЕ. 

УЕ 

incl %edx ,0 — *tedx.1 
BH. ше BPRITEBIN dx ИВЛ 1， 产 生 这 个 寄存 赔 的 新 值 。 

操作 


cmpl Фезі, %ебйх.1 — cc.l 


ІН, ERBE OBAT IESUS UP) ИТ) 比较 免 esi 中 的 值 《这 个 值 在 循环 中 不 会 改变 ) 和 
THERE bed 的 值 。 然 后 ， 它 会 设置 标号 сс.) 标识 的 条 件 码 。 正 如 这 个 例子 说 明 的 那样 ， 处 
FEE n] VARI Ж К ЯО A PHG RT ER ETE, 

最 后 ， 巴 测 跳 转 指 令 会 选择 分 支 。 跳 转 指令 


“1-taken сс.1 
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Ez a boe A GEHE (cel) 是 否 表 明 这 是 个 正确 的 选择 。 如 则 不是 ， 那 么 它 会 发 信号 给 
ICU， 告 诉 它 在 j] 后 面前 指令 处 开始 帮 指 令 。 Auris. HE TES X Pn BESTE П 
的 地 的 信息 。 实 际 上 ， 处 理 器 必须 记录 术 被 预测 方向 的 日 的 地 ， 这 样 一 来 ， 夺 预测 错误 时 ， 它 由 以 
АЖ E ЕЩЕ. 

如 这 个 水 倒 翻 译 表 曲 的 那样 ， 我 们 的 操作 在 许多 方面 模仿 了 汇编 语言 指令 的 结构 ， 际 了 它们 大 
用 标识 涯 存 器 不 同 实例 阅 标 号 来 引用 它们 的 源 和 日 的 操作 的 。 在 实际 的 司 件 中 ， 寄 三 器 重 命 名 动态 
Mb. fel EXER. icit SX EB medii" KERFS А, BA 
FB rS FS 87. 

B mom ЕЕ 

图 5.13 以 两 种 形式 展示 操作: -种 是 指令 解码 器 生成 的 形式 , 对 一 种 是 用 计算 图 (computation 
graph) 来 表示 和 的 ， 译 这 种 图 中 ， 操 必 是 用 交角 方 栓 表 示 的 ， 册 箭头 表明 桔 作 之 间 的 数据 传递 。 拒 们 
只 为 一 次 连 代 与 下 一 次 先 代 之 间 改 变 了 的 操作 数 而 显示 舌尖 ， 因 为 只 有 这 些 值 才 奉 丰 能 阅 元 之 回 进 
1r fh. 


load (Зеах, Фейх,0, 4) 
imull t.l, &€ecx.ü 

incl *edx.ü 

cmpl tesi, $edx.1 
]Ji-taken cc.1 





8 5.13 整数 乘法 的 combines 的 内 循环 第 一 次 迭代 的 乘法 操作 
在 傅 炭 读 被 亚 式 地 转换 成 了 加 载 。 寄 丰 器 名 字 是 用 实例 号 码 〈instanee number) 标记 的 ， 


每 个 谋 作 符 方 在 的 曲 卉 表明 这 个 操作 和 直 要 多 少 个 局 期 ， 也 就 是 这 一 种 切 能 的 换行 时 间 。 华 此 ， 
整数 乘法 imull 沉 要 四 个 周期 ， 加 载 需 要 三 个 周期 ， 而 其 他 操作 需要 一 个 周期 。 在 展示 一 个 循环 的 
计时 中 ， 我 们 将 块 竖 直 地 放置 ， 来 表示 操作 执行 的 时 间 ， 向 下 的 方向 表示 时 间 的 增长 。 我 们 可 以 看 
到 ,循环 的 五 个 操作 形成 了 两 个 并 行 的 链 ， 表明 两 个 计算 序列 必须 顺序 弛 执行 。 左 边 的 链 处 理 数据 ， 
首先 从 存 刍 器 中 读 … 个 数 给 元 素 ， 然 后 用 它 乘 以 累积 的 习 积 。 布 边 的 链 处 理 循环 家 3| o BENE 
Wl REEE 与 length 做 比较 。 跳 转 操作 检查 这 个 比较 前 结果 ， 以 确定 分 支 预 测 是 I 上 确 的 。 注 最， 
从 醉 绫 操作 方 框 中 没有 向 外 的 箭头 。 如 果 分 支 预测 正确 ， 不 需要 任 们 处 理 ， 如果 分 六 预测 错 次 ， 那 
么 分 支 功能 单元 会 发 信号 经 指令 取出 控制 单元 ， 而 这 个 单元 会 采取 改正 的 行动 。 励 论 是 岗 种 销 忱 中 
的 哪 一 种 ， 其 他 的 操作 都 不 惊 赖 于 跷 转 操 作 的 结果 。 

А 5.14 ib ПЕНЕН МЕНЕ, HAE REGE ЖИЛЫ. ЖИН АРТА. 所 有 有 的 操 
作 ， 除 了 加 载 色 外， 现在 玫 只 下 要 一 个 周期 。 
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Load (%еах, *edx.0, 4! 
айа! t.12, Фесх.0 


ІПСІ Жейх.0 
сәрі $esi, %едх.1 
jl-taken cc.I 





图 5.14 整数 加 法 的 combines 里 面 循环 第 一 次 迭代 的 操作 
与 果 法 相 水 ， 惟 “的 变化 是 如 法 媒 帮 只 需要 个 周期 ， 


HAR RRE WE 

^ SUR Ш-Н, ВЕБ АЕ, РАЖ ВЕЖ ЛЕ 
ШУ ЖИЙ. H ЕВО Е ЕЙІН, ЗАВАА ВЕНЕРЕ Т. XEM ЕНІН 
ERZ F 31838 АЧИ: ЭНЕН ЛАТТЕ НД ЕШ, БЕЛЕР ЖЕШ Е. Bl 5.15 给 出 的 
K EK: BUS К ЖЕЕ combine4 АНЫ ЖЕКЕ. ХЕ ЮЖ, 都 有 一 组 五 个 
操作 ， 形 式 与 图 $.13 PURI TEE, mee NU ss E. ARERR ERAS ok 
代办 操作 数 的 第 藉 表 组 了 各 个 选民 之 间 的 数据 相关 。 

根据 没有 朝 上 的 和 涉 这 -限制 条 件 ， 每 个 操作 都 坚 直 地 攻 在 尽 可 能 高 的 位 置 ， 因 为 朝 上 的 得 头 
表明 售 息 流 辣 过 去 的 时 间 。 因 此 ， 只 要 前 一 次 迭代 的 incl 操作 产生 了 循环 索引 《loop index) 的 更 新 
ЇЕ, КЖ) load ЕМЕНІ. 

这 个 计算 图 展示 了 执行 单元 对 操作 的 并 行 执行 。 每 个 周期 中 ， 图 上 一 条 水 平 线 上 的 所 有 模 作 是 
并 行 执行 的 。 这 个 图 还 展示 了 乱 序 和 投机 执行 。 例 如 ， 一 次 迭代 中 的 incl 操作 在 前 一 次 迭代 的 下 指 
令 开始 之 前 就 执行 了 ， 我 们 还 能 看 到 流水 线 化 的 效果 。 每 次 选 代 从 头 至 尾 至 少 需要 七 个 周期 ， 但 是 
随后 的 选 代 每 四 个 周期 就 能 完成 。 因 此 ， 有 效 处 理 频 率 是 每 四 周期 一 次 退 代 ，CPE 40. 

素数 习 法 四 个 周期 的 执行 时 间 限制 了 处 理 器 对 这 个 程序 的 性 能 。 每 个 imull 操作 必须 等 待 自 到 
前 - 个 换 作 完成 ， 因 为 在 开始 之 前 ， 它 需要 这 次 乘法 的 结果 。 在 我 们 的 图 中 ， 习 法 拘 作 在 周期 4、8 
和 12 上 开始 。 在 随后 的 和 代 中 ， 每 四 个 周期 开始 一 条 新 的 乘法 。 

图 5.16 展示 了 在 一 个 有 无 限 名 个 功能 单元 的 机 器 七 ， 整 数 加 法 的 combines ОО, ад 
未 合并 操作 只 需要 一 个 周期 ， 程 序 的 CPE 就 能 达到 1.0。 我 们 看 到 随 着 循环 的 进行 ， 执 行 单 元 就 能 
每 个 时 钟 周期 执行 七 个 操作 的 -- 部 分 了 ,例如 ,在 周期 4 中 ,我 们 可 以 看 到 机 器 在 执行 近代 1 addl, 
9452. 3 和 4 的 load ЖЕШ АТ ЖЕ 2 Вр, Е 3 108 empl А 89 incl. 

资源 约束 下 的 操作 调度 

当然 ， “个 真实 的 处 惠 器 只 有 固定 数 日 的 功能 单元 。 和 我 们 前 面 的 例子 不 同 ， 在 那些 例子 中 ， 
性 能 只 受 数据 相关 性 和 功能 单元 的 执行 时 间 的 限制 ， 现 在 性 能 还 受 资源 约束 的 限制 。 特 别 地 ， 我 们 
的 处 理 器 只 有 两 个 单元 能 执行 整数 和 分 支 操 作 。 相 反 ， 存 图 5.15 中 ,周期 3 中 有 三 个 此 类 操作 在 并 
行 执行 ， 而 周期 4 中 有 四 信 在 并 行 执行 ， 

图 5.17 展示 了 在 -个 有 资源 约束 的 处 理 器 上 ， 整 数 乘 法 的 combine. 的 操作 调度 。 我 们 假设 通 
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Rit d h oc R ЖЛ} л ERE RE f НІНЕ T IHE IE, ТЕН £ TE HORE ЕҢ 
ІНІН, А ЦА о ФИЯ. [ШАДЕН imull WE ЕЕЕ — + R lt]. 

HARRER ЙИП ЖЕНА ЖӨ, Ed E THEBIS E Eu um А 
ЖЕ. Иш. PH 5.15 РЕЖЕ 3 h, Вт Г РЕНИ АТИНЕ. {К II j 
{2 cmpl 303340 3 ff] incl. ТІН 5.17 28, ПРИН ЕТ В Ae Tren 
ЖЕНИЛ ЖЯ (program order? RRRS. AFEFE АНЕ АЕ FR LRL К 
БТН, ЖЕЛІНЕ, ЖӘПЕ НЕНІ ГЕН ГЕМЕНЕ ТЕЛЕ. 在 此 例 中 ， 
ЭП МЕК incl 8 E, МАТА ИННИ FE E RII p Ro ETC E82 HIER I. (ШШ. 
(EIE Ar, CETERIS 1 的 imall &TER F m Ú 2 86 j! BER ЗЕЕ T ETC 3 É) incl BRE 
Ж. 








Hia 0 


图 5.13 ЗАТТА ИИС ТГ, БЕЖАННЕГНЕЯ 
ЕТТТ Т 





ЧЕТ Г ЖЕ. ИЮ uwa R tA ЕШ ПЕР i. FERE (SR ЕШ ЕЕ ЖЕШ 
A ol dr d ШШ И). 

S INEROBUERMMDS, КЕНЕН ТЕТЕ. СЕНЕН ИЛЕШ УНЫ. 
АИА UAE ME, [Ш.Ж ЕНИН H BTK ПИ ЕЕЕ 
ШТ. ERREEN combined f] £w lun ЖН. ШЖ T В АНА k. Ig 5.18 Ж 
TIER 4 一 8 DURTEBNIF. ПАНА ТИН НІНЕН, ЖИЛЕ T MEI LS ALLE S 
(regular pattern), EET, 4—& P, ИЕШЕ Г ЕНЕ, Б ТЕР: іп 
ETATER. МАҚ ШЫТ, 4-7 КЕНЕЛЕ ЖЫН. Ж. ЖИП ЛАКИН 
ақ, PIRN СРЕ 2.0. 





iita 


H5.6 ЕХЕНБИНЕКЕРНЕНТ, Sixti 
ma gr ERI. ШРШ) СРЕ ШЕҢ La. 
combined 性 能 小 站 
MERIETE F combines ЖЫН A Bode ERU ICM IE PHA E IE RES 


wn | sa 
Маи fer 


M Т ЖОЕ ИРК, ЖӘ ERE ЖЖ ELS er HIER UTERIS, ШЕ S.D Eg. 
(ЕҢ, ПЕНЕН СРЕ 值 降 低 到 侣 并 操作 的 时 间 成 为 限制 因素 ， 

灶 填 连 数 吉 法 的 情况 ， 我 们 看 到 ， 有 限 数量 的 针对 分 支 和 壹 数 禄 作 的 功能 单元 眼 制 了 能 达到 的 
性 能 。 择 次 选 代 有 四 沾 这 类 操作 ， 而 只 有 王 个 功能 单元 ， 我 们 不 能 指望 程序 能 送行 得 比 每 决 选民 2 
个 周期 更 快 了 ， 

Ез РИТЕ Жы, %4-, PAPARA EA p ew ІН PRISE 
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们 的 操作 数 被 计算 出 来 ， 因 为 功能 单元 有 一 个 或 事 个 周期 的 执行 时 间 ， 这 就 设置 了 一 个 证 定 的 操作 
序列 执行 周 期 数 的 下 界 ， 第 二 ， 帝 源 和 约束 限制 了 在 任意 给 定时 刻 能 够 执行 吉 少 个 操作 。 我 们 看 到 ， 
ТАИ НА ААГ ААЙ Й ДЕА ЕВ ЕИ Е Е, Hae d ef ЛЕ ЛАЖ ІНЕН, ELA ICU 
和 EU PH ЖИЫ. ИШ. —F Intel Pentium Ш ЕТЕР SLR ЕШ 406. Еп, 3 
с PORE АН АЛЫИ Г ЖН ЕЖЕ ТИР ЕЕ ПГТ ТЕШЕ ЕНТ PUE IC IEEE. Kiku ER 
Мина, НАУ И КЕЕН ЕТИ KIWE B. 





ms РОНА Т, SERAH 
6: fti oH Ж ЫН ЕЕ Е. 


优化 程序 性 能 ЕТ; 








8515 有 实际 资源 约 东 的 情况 下 ， 整 数 加 法 操作 的 调度 
Wi NW h xin MSi ЕНЕ CPE 2.0, 








VH — AW RB ТЕРІН combined ПЕ, ЖИН. PRERANE d. 但 是 内 有 
аң Ле RE RC ЕЛЕДЕ. АШ efti dep Hp de IE ИЕНЕН. ILE HH EUR 
ИНЖ | Cloop index) 3038 iL 08 8 de ТРАН — n. 

ATAJ CLIM EE О PO W E DR НЕЕ Ж О ЕНЕ M fir HE HE Re d s K 
Ж (loop unrolling) 的 技术 。 I LUE i PUn ju Ni oc KEW RE. ixPH ND RII ES 
ШР ЕҢ, Ban T WR TERN. 

PH 5.19 3 HH ТАП e EC EFI OE RETE DAE. Е kamemm-tx 
W. ERE MERS iR PCIe З, T do Re HERE г. га Ri 2 ЖЕГЕ ЗЕН. 








- code/om/combine c 
1 Оо loop by 3 */ 

? völd combines (увс ptr v, dara t *dest) 

j [ 

1 int length = vec lengkh(w); 

3 int limit = length-2; 

E 


data t *"data = get vec start iv); 
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/ daba L x > IDENT; 

В int 1; 

E 

10 * (Combine 3 elements at a time */ 

21 for (l = 0; i < limir; “+=3) 1 
12 x = x OPES dataí1] OPER Яаѓа [1+1] OPER data[1:is2]; 
13 | 

14 

15 /* Finish any remaining elements */ 

15 for із 1 « length; i++} I 

17 X = x OPER dzta(1il; 

18 І 

19 *dost = Xx; 

zl | 





— —— Сүме/орУсотбіпе с 
519 展开 循环 三 次 
f He НЕМ МЕ ЛИЕ. 


Ж, МЕ KF TRESHE. 8415 8 Bel JE НЕЕ d SE ЕШ S LE, Ж ПА 
БҰРА. НЕМЕ 次 循环 不 会 趋 出 数组 移 界 限 。 对 十 长 度 为 4 的 风量 ， 我 
们 将 御 环 限制 谨 为 n-2。 然 后 ， 我 们 会 保证 具有 当 御 环 吉 引 i 满足 i < n-2 BLA ЇЙ (В, S 
此 最 人 独 组 索引 i+ 2 会 满 是 i4+42<(n-2)+2=n, ЯН, UR EPIIT kik, 我 们 就 把 LRR n-k 
+ d. ЖАБ МИ i +k- mI nds ERUEZ VR, BIMES AMR, ШЕКА TLE 
НҚА jhi Ju US. IXTRRRBERER BUT 02-215. 

Хр ГАР т ae ЕЕ CB ЕНЕ ИП ЖЕЗ Б ИШГЕ R TE ШЕТЕН. 


执行 单元 操作 


addl (*eax,Wedx,3) жеси load {%Жеах, Жейк.0, 4) 


‚149; 


. 
ый 


addl t.la, %есх_ Пс kerx.la 
addl 4[€eax,E&edx,á],t&ecx .oad 4{%еах, &£edx.ü, 4) к L.1b 


addl t.lb, $ecx.la жесх.ір 
addl БІЗеах,Фейх,4),Жесх load Bi%eax, %едх.б, 4) t.le 
addl t.lc, %єсх..Ь Фесх.1с 
addi %есх, 3 addl $edx.ü, 3 Феіх.1 
cmpl $esi, $edx cmpl £esi, $edx.1l cc.1 
Jl .L483 Jl-taker. cc.i 


An TE SE SURE, ШИЖЛАЕНЕЕШ Ж Akim СЕЗНЕ ВЕ, ЯЛЫ Cf Fb g 
ЛЕН ТІНІНІҢ. Р ОКА, -КЕНЕЕЕЛЕННІ Л KS Е EM 
а» ШШ 5.20 Bros. 用 两 个 功能 单元 完成 这 些 操作 ,我 们 潜在 地 能 达到 CPE 1.0. 图 5.21 ЕН. 
ПАША = 6)， 操 作 就 会 遵循 一 种 规则 的 横 忒 。 进 代 4 G = 9) 的 操作 有 同样 的 时 间 
安 徘 ， 只 不 过 移动 了 = 二 个 周期 。 这 会 真正 得 到 СРЕ 1.0。 
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入 们 对 这 个 函数 的 测试 表明 СРЕ 为 1.33, WARR Bak EDIN FR. HUH. ГН 
ТЖ! ЖН ЖЕРЕ ТИЙ. FERES А В, Жш. Dit ЕНОТ ЕЕ OT 
代码 ， 这 个 性 能 还 是 有 改进 的 。 


load [%аах, %ейх.0, 4) 
айй t.làa, *ecx.üc 
load 4|&eax, *edx.0. 41 
addl t.lb, *ecx.la 


load 8|&eax, %әйх.й. 4] 
add] t.le, *ecx.lb 
addl t*adx.Ü, 1 

cmpl tasi, Wedx.l 
jl-taken сс.1 


¿l+ l 141 RF 14 





图 520 ххияек зика Нн 
^ri NH WE Н. AiE URA T WS S kiti TES TEUS TE. 


uL. 
e 





РГ 
85271 有 限 次 源 约 束 情况 下 ， 三 次 展开 的 整数 求 和 损 作 的 调 麻 
ЫН! B han kS CPE LO, PENERE CPE 3 1.13. 


测量 各 种 展开 程度 的 性 能 ， 得 到 如 下 的 CPE 值 ; 





ЕХ ШЕН ЖЕҢ ОЯ. {ЙН ЖЕ НЕЕ СРЕ. ЧИИЯЛЕЯ2 ІҢ, + ОЕ 
da. ТЕҢ, ЖЫР] СРЕ 3/2 = 1.5. SRI ПАТАТ, BL НЕМЕ EATER., 3 
Xr СРЕ HARR 10. АУЕЗ Ui ER H ӘЛ: ЕЛМАЗНЕКЕНИЯАЕ 
地 的 性 能 。 很 明显 ， 在 后 一 种 情况 中 ， 执 行 单元 上 操作 的 请 度 效 率 要 低 一 些 ， 

我 们 的 CPE 测量 值 不 能 解释 开销 因素 , 例如 程序 调用 和 准备 循环 的 开销 。 第 用 循环 有 展开， 我们 
引入 了 一 种 新 的 开销 一 当 同 莉 长 度 不 能 被 展开 度 连 除 时 ,需要 完成 所 有 剩 政 的 元 素 。 为 了 研究 开销 
Жан, ЇЇ Т ЖЛ ШЕЕ ЛЕ Ж CPE (net CPE). ЖСРЕ 是 这 样 计算 的 ， 过程 需 要 的 总 周期 
数 除 以 元 素 的 个 数 ， 对 于 不 同 展开 度 和 两 个 不 同 的 问 量 长 度 ， 我 们 效 得 下 面 的 数据 ， 





ЖКА ЖІ, СРЕ 和 净 CPE 的 差别 很 小 ， 从 长 度 为 1024 的 测量 值 就 能 看 出 来 ;但 是 对 于 
短 问 最 洲 说 ， 影 响 就 很 明显 ， 从 长 度 为 31 的 同 量 的 测量 值 就 能 看 出 来 。 我 们 长 度 为 31 的 问 量 的 净 
СРЕ 的 调 量 值 展 示 本 箱 环 展开 的 一 个 缺点 。 即 局 不 展开 ， 悼 СРЕ 4.02 比 长 问 量 测 出 的 2.06 ИЕ 
多 。 当 衢 坏 执行 较 少 次 时 ， 开 始 和 完成 循环 的 开销 变 得 更 加 重要 。 另 外 ， 循 环 展 开 的 好 处 就 不 孝 么 
明显 了 。 展 开 后 的 代码 必须 启动 和 停止 两 个 循环 ， 而 且 它 必须 每 次 -个 好 完成 最 后 的 元 素 。 循 环 户 
开 增 如 ， 开 销 会 降低 ， 而 最 后 循环 中 执行 的 操作 数 会 增加 。 当 向 量 长 度 为 1024 时 , 性 能 通常 会 随 着 
展 半 度 的 增加 而 收 进 。 当 向 量 长 度 为 31 时 ， 展 开 度 只 为 3 时 能 得 到 最 好 的 性 能 。 

御 环 展开 的 第 二 个 缺点 是 它 增 加 了 咎 成 的 革 标 代码 的 数量 。combine4 的 日 标 代 伺 需 上 昌 63 E T5. 
但 喜 衢 未 展开 度 为 16 的 日 标 代 码 需 要 142 35. 在 这 种 情况 中 ,代码 运行 得 几乎 快 了 一 倍 ， 羽 乎 鉴 
付出 小 小 的 代价 。 不 过 在 其 他 情况 中 ， 这 人 时 间 - 空 间 的 折衷 中 最 优 的 你 置 还 不 是 很 清楚 。 

旁 注 ， 计 编译 器 展开 循环 

编译 器 可 以 惟 容 易 地 执行 糖 环 民间 ,只 要 优化 钥 别 设置 得 足够 高 (例如 ， 代 化 选项 为 "-02^), 
许多 编译 器 都 能 喇 行 公事 地 做 到 这 一 点 。 在 命令 行 上 以 “-funrnil-ioops” 调 用 GCC, EAI R 
AA. | 


59 转换 到 指针 代码 
在 进行 下 一 步 之 闻 ， 我 们 庶 该 青学 试 一 种 有 时 能 改进 程序 性 能 的 转换 ， 但 这 是 以 程序 的 可 读 性 


为 代价 的 。C 的 个 独特 的 特性 是 能 够 对 任意 的 程序 对 象 创建 和 引用 指针 。 实 际 上 ， 指 针 运 算 与 数 
组 引用 有 很 紧密 的 联系 。 表达 式 *(ati) 给 出 的 指针 运算 和 引用 的 组 合 正好 等 价 寺 数组 引用 alil 有时， 
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我 们 能 够 通过 使 用 指 条 而 不 是 数组 改进 一 个 程 订 的 性 能 。 

图 522 给 出 了 个 将 过 程 combine4 和 combines 转换 成 指针 代码 的 示例 ， 分 曾 得 虽 过 程 
combine4p 和 combine5p。 与 保持 指针 data 固定 在 同 量 的 开始 处 相反 ， 我 们 每 次 选民 时 都 移动 它 。 
然后 ， 通 过 data 的 固定 企 移 量 〈0 一 2) 来 引用 网 量 元 素 。 最 重要 的 是 ， 我 们 能 从 过 程 中 消除 箱 环 蛮 
量 i。 为 了 确定 循环 该 在 什么 时 候 中 止 ， 我 们 计算 一 个 指针 dend 作为 指针 data HLI. ERAI 
程 和 它们 相应 数组 的 过 程 的 性 能 得 到 混合 的 结果 ; 


| 
函数 ты 

combined 335 ЮГЕ ЛЕМ р 400 

combines RT GR X 3 1.33 

combine5x4 RAHA 1.50 5.00 


对 大 多 数 情 况 来 说 ,数组 和 指针 版 本 的 性 能 完全 В. ЛЕЛЕНИ ЖК RU TR EL ПЕ А) CPE 
实际 上 还 变 粳 了 一 个 周期 。 这 个 结果 有 点 奇怪 ， 因 为 指针 和 数组 版 本 中 的 错 环 是 非常 次 世 询 ， 如 加 
5.23 所 示 。 很 难 息 像 为 什么 指针 代码 每 次 选 代 和 需要 多 一 个 时 钟 周期 。 同 样 不 可 思议 的 是 ， 过 程 四 次 
循环 展开 的 上 本 使用 指针 代码 能 产生 每 次 先生 一 个 周期 的 性 能 提高 ， 得 到 CPE 1.25 (ERER S + 
周期 ;»， 而 不 是 15 САКТА). 













code/opt/cambine.c 
1 Р Accumulate in local variable, pointer version */ 
2 vold сопріпейр(чес ptr v, data 上 *dest) 
3 { 
4 int length = vec, lengthi!v); 
5 data t *da-a = get, vec зіагі (у); 
6 data t *dend = dataslength; 
7 data t X - IUENT: 
B 
9 for i; data < dend; datas) 
10 x = x ОРЕВ *data; 
11 *dest = x; 
12 ] 
cade/opt/combine.c 
(a) combined 的 指针 版 本 
code/opt/combine.c 
1 X J*Unrollicop by 3, pointer version */ 
2 void combine5bpivec ptr v, data b *dest) 
3 1 
4 data t %дага = get vec startlvi: 


352 45% 


5 data t *dend = data-svec lengthív); 
Б data L *dlimit = dend-2; 

7 data, t x = IDENT; 

8 

9 Ж Combine 3 elements at a time */ 

10 for 1; data < dlimit: data += å! { 
ll x = x OPER data[0] OPER data[l1] OPER datal[2]: 
12 | 

13 

14 /* Finish any remaining elements */ 

15 Гог {; data < dend; data++] 1 

16 x = x OPER data[Ü0l; 

17 | 

i8 "dest - x; 

19 } 


code/apt/combine.c 


(b) combines 的 指针 版 本 


图 522 将 数组 代码 转换 成 指针 代码 
在 某 些 情况 中 ， 这 能 够 导致 性 能 的 改进 . 


cambine4: type=INT. ОРЕК = 十/ 
data іп %eax, x in Әесх, iin Фейх, length іп есі 


1 „1,24: loop: 
2 add] (€eax,$edx,4],€ecx Add daralt] 10 x 
3 incl £edx Tu 
1 cmpl %esi,%=edx Compare i; length 
2 jl .L24 If <, goto {дор 
(а) Array code 

сөтбіледр: typez INT, OPER = '+' 

data іп вах, x in Фесх, dend in %edx 
1 „1,30: loop: 
2 addl (%оах), %есх Add dataj] to x 
3 addl 54,%еах data ++ 
4 cmpl Жейх,Феах Compare data:dend 
5 jb .L3C If <, goto loop 


(b) Pointe: code 


图 5.23 EREEREER S 
RARI FB P PS, ЕВИ КЕ о НИ, mit REST. 


КИПЕ, ЗЕТА А А РЕВЕ ATILA ЖЕН, EET ТА. 
我 们 已 经 看 过 编 详 器 , ПА ЙИШ ЛУ Н EA ІН ОМ, TAE EERE A МН BERE RE. 
^ PRERA АА JR E, 
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ӘН 54 
有 时 候 ，GCC 会 自己 将 数组 代码 转 接 成 指针 代码 。 例 如 ， 使 用 整数 数据 和 以 加 法 作为 合并 操作 
时 ，GCC 为 combines 的 一 个 变种 的 内 捅 环 产 生 下 列 代 码 ， 使 用 的 是 六 次 御 环 展开 : 


LE: 

addl {%еах), едх 
addl 4 (%еах), $edx 
addl 8 (%еах), %едх 
addl 12 {%еах),%едх 
addl 16{(еах), едх 
addl 204(€*eax),€edx 
addl Z4[*eax],*edx 
ада: 28 (%еах), %едх 

0 addl 522, %еах 

11 addl 55, жесх 

12 cmpl $esi,tecx 

13 jl .L5 


С А beak 是 如 何 每 次 选 代 增加 32 的 ， 
习 出 过 程 combine5px8 的 CC 代码 ， 展示 这 段 代 码 是 如 何 计算 指针 、 猎 环 变 量 和 中 止 条 忻 的 接 


ЕШ 5.19 的 风格 ， 给 出 使 用 任意 数据 和 合并 操作 的 通用 格式 。 描 述 它 与 我 们 手写 的 指针 代码 (图 
522) EAT IE BI, 


к өз ud — ін wl Ық c го ғ 


510 提高 并 行 性 

在 此 ， 我 们 的 种 序 是 受 功 能 单元 的 执行 时 间 限 制 的 。 不 过 ， 区 图 5.12 中 第 三 栏 所 示 ， 处 理 器 的 
几 个 功能 单元 是 流水 线 从 的， 这 意味 着 它们 可 以 在 前 一 个 操作 党 成 之 前 开始 … 个 新 的 操作 。 我 们 的 
代码 不 能 利用 这 种 能 力 ， 即 使 是 司 用 窒 环 展开 也 不 能 ， 这 是 因为 我 们 将 累积 慎 放 在 -个 单独 的 变量 
* 中 。 直 到 前 面 的 计算 完成 之 前 ， 我 们 都 不 能 计算 x 的 新 值 。 因 此 ， 处 理 器 会 暂停 (stal), ЗЕН 
始 新 的 操作 ， 直 到 当前 操作 完成 。 图 5.15 和 图 5.17 中 很 清楚 地 展示 了 这 个 限制 。 即 使 有 讯 限 的 外 


于 器 换 源 ， 当 法 器 也 只 能 每 四 个 时 钟 周 期 产生 一 个 新 的 结果 。 对 于 浮 点 加 法 《三 个 周期 ) ИЕ CR 
个 周期 》 也 会 有 类 似 的 限制 。 


5.10.1 187781 (оор splitting) 
对 于 一 个 可 结合 和 可 交换 的 合并 操作 来 说 ， 比 如 说 整数 加 法 或 匀 法 ， 我 们 可 以 通过 将 一 组 合并 操 
作 分 割 成 购 个 或 更 多 的 部 分 ， 并 在 最 后 合并 结果 来 提高 性 能 。 例如 ，P, 表示 元 素 а as ava 的 乘积 


如 一 | 
P, - П а; 
{=Ù 


Bin ABE ЭТАН БР, = РЕ, xPO, ОҢ PE, 是 索引 值 为 偶数 的 元 素 的 乘积 ， 而 
PO, ЖОН аЛ ЗЕН. 
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ni1-2 
PE, = аз; 
{=й 
лї2—2 
РО, 一 аз 
i-Ü 


图 524 Bon fpe (E HL CREE EE И. ЕВЕ ТАЯДЫ», ОАО GOES € л, 
З, 也 使 用 了 两 路上 条 行 , POSU S CEU JUR RUE SE E x0 rh, ПОБИВА НОО REESE 
量 x] h. AWE = 样 , Bed bia F3 ЧЕМ, У-Н SKIES 2 的 倍数 时 ， 这 个 循环 机 累积 
HAP PECTUS. Жи, ЖАЛПА x0 和 x] 庶 几 人 台 并 操作 ， 计 算 最 终 的 结果 。 


eoo codeontyeombine,c 
] /* Unroll loop hy 2, 2-way parallelism */ 

2 vaid сопоілевіуес ptr v, data t *dest) 
3 l 

4 int length = vec _ lengthivy: 

5 int limit = length-l: 

5 daLa t *data = get vec startívi: 
Н Gata t xü = IDENT; 

> data t xl = IDENT: 

9 nt i: 

10 

11 ж Combine 2 elements at a time */ 

12 for ii = б; i < limit; i«-2) f 
13 x] = хо OPER data[il; 

14 x] = хі OPER data[i«ll; 

15 ) 

16 

17 i* Finish any remaining elements */ 

18 -or i; 1 < length; i++) 1 

19 XÜ = xÚ OPER datàlil; 

29 | 

21 “дені = xÚ ОБЕҢ x1; 

22 | 


codefopt/combine.c 


图 5.24 二 次 展开 钼 环 并 使 用 二 路 并 行 
这 种 图 法 利 月 广 功能 单元 的 流 术 线 能 几 。 


为 了 了 了解 这 个 代码 是 如 何 提 高 性 能 的 ， 让 我 们 来 考虑 对 于 整数 乘法 情况 的 循 坏 到 操作 的 项 
详 : 
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„151: 


imu.l iteax,*edx,4],*ecx load {%еах, Жейх.0, 4) 


imull t.la, Ф%есх. 0 
imu.l 4/$eax,t*edx,4),X*ebx load 4і%рах, &edx.ü, 41 
imull t.1b, &ebx.ü 
addl 52,&kedx addl 52, %edx.L 
стр] $esi, edx cmpl &esi, Фейх.1 
il .Li51 jl-taken cc.1 


图 5.25 给 出 了 第 一 次 选 代 《i=0) 的 操作 的 图 形 化 表示 。 正 如 这 张 表 说 明 的 那样 ， 循 环 中 的 两 
个 来 法 是 相互 独立 的 。 -个 以 寄存 器 和 ecx 作为 它 的 源 和 的 (对 应 于 程序 变量 х0), IS 7 T ARI 
存 器 锡 ebx 作为 它 的 源 和 日 的 《对 应 于 程序 变量 x1)。 第 二 个 乘法 在 第 -- 个 的 后 一 个 的 后 一 个 周期 就 
可 以 开始 了 。 这 利用 了 加载 单元 和 整数 乘法 器 的 流水 线 化 的 能 力 。 


tedx 0 





执行 单元 操作 










load {$eax, %ейх.б, 4) — t.ia 
imull t.la, $ecx.0 — бесх.1 
load 4 (%вах, Ф%ейх,0, 4) — t.1b 
imull t.1b, Sebx.0 — &ebx.1 
add] $2, едх. 0 — *edx.1 
сірі sesi, Фейх.1 — сс.1 


jl-taken cc.1 





ІН 525 二 次 展开 、 二 路 并 行 的 整数 乘法 内 循环 的 第 一 次 迭代 操作 
8 ЖЕНЕ РН Ih rn. 


图 5.26 给 出 的 是 整数 乘法 的 头 三 次 选 代 (i=0，2 和 4) IEEE Go. HATERA, PRISE 
法 都 必须 等 待 ， 直 到 前 一 次 选 代 的 结果 计算 出 来 。 这 个 机 器 还 是 能 每 四 个 时 钟 周 期 产生 两 个 结果 ， 
得 到 上 理论 上 的 СРЕ 2.0。 在 这 幅 图 中 ， 我 们 不 考虑 整数 功能 单元 的 有 限 集 含 ， 但 是 也 没有 证 明 它 
是 这 个 特殊 过 程 的 限制 。 

比较 只 进行 循环 展开 和 使 用 循环 展开 以 及 两 足 并 行 ， 我 们 得 到 以 下 的 性 能 ; 


方 法 
展开 X2 1.50 400 3.00 5.00 
combines 154 ЕҢ X2, Fir х2 1.50 2.00 2 00 2.50 


对 于 整数 求 和 ， 并 行 化 并 没有 帮助 ， 因 为 整数 加 法 的 执行 时 间 只 是 一 个 时 钟 周期 。 不 过 对 于 整数 和 













156 Ж s $ 





АШ, ЖИГИ СРЕ ЖР T 158. MERER. ЕТО НЕНА Р Тал. M TIPS X 
ӨЕ ЕРНИН CPE 限制 在 了 20， 面 不 是 理 说 值 1.5。 

我 们 早 就 知道 ， 二 进 制 补 码 运算 是 可 变换 和 可 周全 的 ， 甚 至 于 洲 出 时 也 是 如 此 。 因 此 ， 对 于 各 
菇 数据 汰 型 ， 在 所 有 可 能 的 情况 下 ，combinef 计算 出 的 结果 都 和 combines 计算 出 的 相同 。 因 此 ， 
КИЛЕНЕН ЕЕ combined 中 所 示 的 代码 首先 转 的 成 combines 的 一 个 二 路 锋 环 展开 变种 ， 
КЕННЕН ШАЭНТЕ., 将 之 转换 成 combines 的 一 丫 变种 ,在 优化 编 详 器 的 语言 中 , IER Қ 
Vi (ieration splitting}。 许 名 编译 握 自 动 进行 袜 环 展开 ,但 是 进行 造 人 分 制 的 编译 器 相对 出 较 少 了 ， 
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图 5.26 (NHROMNART, CARR. синий ЕЕЕ 
ЕНЕС ТАНЕ ЕТТ. 

H-H. ЗОГОН АЫ Rupi Ruta yt), Ж, Д БАН. combines 和 
combine6 TIAE ЕЖЕ АЖ. Бш, HERRE., MAR ИЛ GEH 4E 
常 大 的 数 ,而 索引 值 为 奇数 的 元 素 都 非常 接近 于 Q.0。 MA. ОЕЕО P. Жән, ЖЫ РЕ, 
也 可 能 流出， 或 者 pg, 也 可 能 下 进 。 不 过 在 大 这 数 现 实 的 程序 中 ， 不 太 可 能 出 现 这 妊 的 情况 。 因 为 
大 字数 物理 现象 是 术 续 的 ， 所 以 数字 数据 也 区 向 于 相当 的 平 清 ， 不 会 出 什么 问题 。 即 使 是 有 不 连续 
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ЕК, КИП Ж ЕЛ САТ Ж ЛЕНЕ ИНЕ д. ЕЕ ЕНЕ л Ж АТА Ku] 
能 会 有 比 “ 分 成 两 组 独立 求 和 ， 然 后 再 将 这 两 个 和 相 加 ”根本 上 更 好 的 准确 性 。 对 大 多 数 应 用 徇 序 
来 说 ， 售 性 能 翻 倍 要 比 对 膏 怪 的 数据 模式 产生 不 同 的 结果 的 风险 更 重要 。 但 是 ， 程 序 开 发 人 员 应 该 
本 溢 企 的 用 尸 协商， 看 看 是 否 有 符 萄 的 条 件 ， 可 能 会 导致 媒 改 后 的 算法 不 能 接受 。 

试 像 我 们 能 以 任意 次 数 天 展开 循环 ， 我 们 也 可 以 增加 并 行 度 为 任意 因子 p. A k TUUM p € 
WR. 下 曾 是 对 于 不 同 展 开 次 数 和 并 行 度 的 一 些 结果 : 


, HRX? 


ЖЕНЕ ХО 


, ЖЕНЕ? 
, ЕП XA 
, НІН ХЕ 
‚НТЛ ХЗ 


ЕХ K e OCH ЈАВНЕ, АРЕ БЗМІНЕНӘНЛНЕ АН ЖТА, BERE 
МСБ НУК, ТЕНЕ КИИ Г. ЕР, ЗИК HB РВ [ОРАЛУ ЖА. 


5.10.0 寄存 器 溢出 (register spilling) 

АТОЕВ ДЕБЕДИ Я С нЕ RE A ШОН. ЖЕЛІН, ТАЗ2 指令 集 只 有 很 少 基 的 
寄存 跨 来 仔 放 黑 积 的 值 。 如 于 我 们 有 并 行 度 p ЧТЕНИИ, ВАТА 
(spilling), 将 菜 些 临时 值 存 放 到 栈 中 。--… 旦 出 现 这 种 情况 ,性 能 会 急剧 下 降 。 当 我 们 试图 使 p=8 时 ， 
对 我 们 的 基准 程序 就 发 生 了 这 种 情况 。 我 们 的 测量 值 显示 此 种 情况 下 的 性 能 比 p=4 时 的 性 能 更 差 ， 

对 于 整数 数据 类 型 的 情况 ， 总 共 只 有 八 个 整数 寄存 器 可 用 。 其 中 有 两 个 〔%ehp 和 %esp) 1815 
栈 中 汐 区 域 。 在 这 段 代 码 的 指针 版 本 中 ， 剩 下 的 六 个 寄存 器 中 有 一 个 要 存放 指针 data， 还 有 一 个 要 
李 放 停止 你 置 dend。 这 就 只 剩 下 四 个 整数 寄存 器 可 以 用 来 存放 黑 积 的 值 了 。 在 这 段 代 色 的 数组 版 本 
中 ， 我 们 需要 三 个 寄存 器 来 保存 循环 索引 值 i、 停 止 索 引 值 limit， 以 及 数组 地 址 data。 这 就 只 剩 下 
三 个 整数 寄存 器 可 以 用 来 存放 累积 的 值 。 对 于 浮 点 数据 类型 ， 我 们 需要 从 个 寄存 器 中 的 商 个 来 保存 
中 人 则 什 ， 剩 上 六 个 用 于 昧 积 值 。 因 此 ， 我 们 能 得 到 在 发 生 寄存 器 溢出 之 前 ， 报 大 并 行 度 为 6。 

八 个 整数 和 八 个 浮 点 寄存 器 的 限制 是 IA32 指令 集 的 不 幸 产 物 。 前 面 讲 到 过 的 重 命名 机 制 消除 
了 寄存 器 名 宇和 寄存 器 数据 实际 位 置 之 间 的 联系 。 在 现代 处 理 器 中 ， 害 存 器 名 字 只 简单 地 用 来 标识 
ЖИЕН pu. [EMG ERER E. ЛАУ 只 提供 了 很 少量 的 这 样 的 标识 符 , 限制 了 在 程序 中 能 表达 的 并 
条 性 的 数量 。 

通过 税 碍 汇 网 代 后 就 能 砾 现 洪 出 的 发 生 ， 例 如 ， 在 八路 并 行 的 代码 的 第 个 循环 中 ， 我 们 看 到 
下 面 的 指令 序列 ， 


typez INT, ОРЕК = ' * ' 
хб in -12(%ebp), data+i іп Феах 
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1 movl -12{łebp),%edi 

2 imull 24 (%еах), еді 

3 movl Ф%ед1,-12{%ерр) 
(Fi EVE, ТЕРИУЕЖН ЖИА x6. JV pap hi PASH ЖАН. ТА ЧЕ 
П) ПА, ЕЕ 1л, БАННАНЫ- ЕМЕ. 作为 一 条 通用 诛 
由， 无 论 何 时 当 一 个 编 详 了 的 程序 显示 出 在 某 个 频繁 使 用 的 内 循环 中 有 寄存 器 谥 出 的 迹 银 时 ， 它 都 
会 怖 目 于 重 写 代 码 ， 使 之 需要 较 少 时 临时 信 。 通 过 减少 局 部 变量 的 数量 能 够 艇 到 这 一 点 。 


%5% 


Get xñ from stack 
Multiply by ашай +6] 
Put xó back 


下 面 给 出 的 是 根据 combine6 $5 —/ p P АҚЫ, db B| T ЛАД OR T deu eT, 


练习 是 5.5 

1 ‚1157: 

2 addl {Жеах),%есх 

3 addl 4 {(%еах), %езі 
à addl 8 (%еах!, еа 
5 айат 12{%еах),%еһх 
б addl 16(%еах), *есх 
7 addl 20(%еах),%ез1 
Ë addl 24 (еах), edi 
9 addi 28 {%еах) ,%ерх 
10 addl 532, *еах 

13 addl 58, %едх 

12 cmpl -# {еро}, edx 
13 jl .L152 


А. ПАЖАР? 


В. ЖЫ Т Жр Д1 ? 
C. ЭЖ LER SÉ H deo | Ж b Rab НЕЕ" 


使 用 浮 点 数据 时 ， 我 们 希望 将 所 有 的 局 部 变量 都 放 在 浮 点 寄存 器 栈 中 。 我 们 还 需要 保持 栈 项 可 
用 于 从 在 储 器 加 载 数 据 ， 这 限制 了 并 行 度 小 于 或 等 于 T. 


510.3 对 并 行 的 限制 

对 于 我 们 的 基准 程序 ， 主 要 的 性 能 限制 是 由 于 功能 单元 的 能 力 。 如 到 5.12 Bros, ARRERA 
浮 点 加 法 器 只 能 每 个 时 钟 周期 发 起 一 条 新 操作 。 这 , 加 上 对 加 载 单元 的 类 似 限制 , 将 这 些 情况 的 CPE 
限制 在 了 1.0。 浮 点 乘法 器 只 能 每 两 个 时 钟 周期 发 起 一 条 新 操作 。 这 就 将 这 种 情况 的 CPE 限制 在 了 
2.0。 忆 于 加 载 单元 的 限制 ， 整 数 求 和 被 眼 制 在 了 CPE 1.0， 这 就 导致 了 下 面 对 达 到 的 性 能 与 理论 要 


[RZ [8 BS EGRE: 





优化 程序 性 能 359 


在 这 张 表 中 ， 为 每 种 情况 ， 我 们 都 选择 能 达到 最 佳 性 能 的 展开 和 并 行 的 组 合 。 对 于 整数 求 和 和 
乘积 以 及 浮 点 乘积， 我 们 能 够 接近 理论 极限 值 。 某 个 〈 或 某 些 ) 与 机 器 相关 的 因素 将 浮 点 溢 法 能 达 
到 的 СРЕ 限制 末了 1.50. m^ Je ERIS 1.0. 


85 5.6 
考虑 下 面 的 计算 nn 个 整数 的 数组 来 积 的 函数 .我 们 三 次 展开 这 个 种 环 . 


int aprodíint a[], int n) 
l 

int 1, X, у, 7; 

int r = 1; 

for {1 = б; i < n-2; l+= 3) [í 

X = ali]; y = а[1+1]; z = ali+2]; 

Ff = r * х * ү * oroduct computation %/ 
] 
for (; i < n; X++) 

r *- ali]; 
return r; 


) 


Я +5 7) Product computation 的 行 ， 我 们 可 以 用 括号 创建 出 计 黄 的 五 个 不 同 的 结合 ， 如 下 
所 示 : 
(ir * x) * y) * 2; /% AY */ 
(xr іх * y)) * z; /* A2 */ 
r * (IX * y] * z); /* АЗ */ 
r* (x * (y * zj); /* h£ */ 
(r* x) * iy * 2); /* A5 */ 

我 们 在 Pentium IH 上 测试 了 济 数 的 这 五 个 版 本 。 回 想 一 下 图 5.12， 在 这 种 机 器 上 整数 乘法 操 
作 的 执行 时 间 为 4 个 周期 发 射 时 间 为 1 个 周期 。 

下 面 的 束 给 出 了 一 些 CPE 6048, SiS Td, 测量 出 的 CPE 值 是 实际 观测 到 的 ,“ 理 论 CPE” 
的 毫 思 是 当 限 制 汉 素 只 为 执行 叶 间 和 奈 数 来 法 器 时 能 够 达到 的 性 能 ， 


ы K H ĦA 
J n aà dom 


I = 





ЖЕНЕ. АҒАН CPE 的 度量 值 , 你 可 以 使 用 如 自 其 他 有 相同 计算 行为 的 版 本 的 
值 . 对 于 CPE 的 理论 值 , 你 可 以 只 考虑 来 法 器 的 执行 时 间 和 发 射 时 间 , 确定 一 次 选 代 所 需 的 周期 数 ， 
然后 再 除 以 3, 
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5.11 综合 : 优化 合并 《Combing) 代码 的 效果 小 结 


现在 ， 我 们 已 经 考虑 了 合并 (Combing) 代 瑾 的 六 个 版 本 ， 其 中 有 的 还 有 多 个 朗 种 。 让 我 们 暂 
但 .上 ， 来 看 看 这 种 加 力 的 驾 体 效果 ， 以 及 我 们 的 懂 码 是 如 何在 一 癌 不 同 的 机 器 上 执行 的 。 图 5.27 
给 出 的 是 对 我 们 所 有 函数 以 点 几 个 其 忆 变 种 的 度 景 性能。 正如 看 到 的 那样 ， 我 们 只 要 简 理 地 展开 区 
环 光 次， 号 能 达到 整数 求 和 的 最 大 性 能 ,但 是 对 于 其 他 操作 ， 我 们 引入 一 些 ‘但 不 是 很 多 ) 并 行 性 。 
整体 性 能 达到 了 27.6 倍 ， 比 我 们 原始 的 代码 好 了 很 多 . 


combinel К K IL tt 13.1 A: 
combinel i do imr -o2 
combinez ЖАЛ чес length 
combine : 直接 数据 访问 


сотр: пел қ 黑 积 有 临时 变量 中 
comb inet ЕЛх4 
ETIS 
combines ЕҢ х2, ЖХ? 
RGT XA, 并行 XX? 
BAS. FITXA 





图 527 па АЖНО 
PHE REA HRR. 


5.11.1 FAEERE 

Bj 5.27 BATHAR — Ж. 当 我 们 从 将 combines ЗЕН ЖЕНЕ ЖЛ. 到 将 combined 
КМЖ iF PA S AR D. DEG REESE БИДЕ AAT. Aa А 7 nv, Aa 
行 就 快 了 23.4 486. НАН AETERNA. fe А РЕВЕ RTA, АИИ 
CFI Il iZ АК. AERE 32063. 

` SSK ah, Жїн hihi ЖОЙ, ШЖК АНИ ЖЕКЕ ЙЕР. HET ATER 
事情 会 发 生 。 即使 功能 单元 的 周期 数 是 相当 的 , БЕНЕН a Musk Ж ЗЕ DO PE BE UR ЖН Ж. 
(с АЛА 处 理 器 土 ， 所 有 的 浮 点 操作 都 是 以 扩展 的 ВО 位 精度 执行 的 ， 而 浮 点 寄存 器 也 是 局 照 这 
ARATE. 只 有 当 寄 看 器 中 的 什 写 入 存储 器 中 时 , 才 把 它 转换 成 32 位 ОҚО пй 64 {у O08 
RS DB. 

A ETE EA rH] Sra. PBB PS RR RS T WAR — ERE 1024 的 向 量 上 执行 的 ， 
这 个 巾 量 的 每 个 元 素 НАЗЕ TP +1. 因此， 我 们 是 在 试图 计算 1024!， 它 大 约 是 54x10. xxt 
ЖЕ 一 个 数 可 以 用 扩展 精度 的 浮 点 格式 《 它 可 以 表示 到 大 约 10 MO 表示 ， 但 是 它 大 大 超出 了 
单 精度 【大 约 10°) 或 双 精 度 CAH 1075). 能 表示 的 范围 。 当 我 们 到 达 二 34 时 ， 单 精度 的 情况 就 会 
Ad Dm A4525[/i171 时 , 双 精 度 的 情况 就 会 溢出 了 .一旦 我 们 达到 这 一 点 ,每 次 执行 combine3 
[ПИЯ ЖИЙИ ЕНІ; 
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*dest = *dest OPER val; 


都 要 从 dest оо, WERA val. (fleo. ЖЕЖЕЖНІ dest. 很 明显 ， 这 个 计算 的 某 个 部 
分 需要 比 浮 点 乘法 所 要 的 正常 的 五 个 时 钟 周期 长 得 多 的 时 间 ， 实际 上 ， 对 这 个 操作 进行 出 试 ， 我 们 
БЕЫН- МЕЛ ХЕ 110 一 120 个 周期 很 可 能 , 硬件 察觉 了 这 个 特殊 情况 , 发 出 一 个 联 
BE trap)， 它 会 使 一 个 软件 函数 执行 实际 的 计算 。CPU 设计 者 觉得 这 样 的 情况 会 非常 罕见 ， 以 件 于 
他 们 不 需要 用 硬件 设计 的 一 部 分 来 处 理 它 。 对 于 下 溜 也 会 发 生 类 似 的 行为 ， 

当 我 们 在 每 个 向 量 元 素 等 于 LO 的 数据 上 运行 基准 程序 时 , 对 双 精 度 和 单 精度 ,combine3 的 СРЕ 
都 达到 了 10.00 周期 。 这 与 对 其 他 数据 类 型 和 操作 进行 度量 到 的 时 间 更 加 一 致 ， 而 明 与 combined 的 
时 间 也 是 相当 的 。 

这 个 示例 说 明了 评估 程序 性 能 的 -- 个 挑战 ， 承 本 看 上 去 无 忠 轻 重 的 数据 和 操作 条 件 能 严 量 地 影 
响 测 量 结 果 。 


5112 ”变换 平台 
虽然 我 们 是 在 一 个 特殊 的 机 器 和 编译 器 环境 中 讲述 我 们 的 优化 策 咯 的 ， 伍 是 通用 的 原则 也 适用 
于 其 他 机 器 和 编 洋 器 。 当 然 ， 最 优 的 策略 可 能 是 与 机 器 相关 的 。 作 为 一 个 示例 ， 图 5.28 给 出 的 是 
Compaq Alpha 21164 处 理 器 在 与 图 5.27 中 所 示 的 Pentium M 相当 的 条 件 下 的 性 能 结果 , 这 些 测试 及 
用 的 是 Compag C 编译 器 生成 的 代码 ， 它 使 用 了 比 GCC 更 多 的 高 级 优化 。 我 们 观察 到 ， 随 着 我 们 治 
着 表 往 下 走 ， 周 期 时 间 通 常会 降低 ， 就 像 对 其 他 机 器 一 样 。 我 们 看 到 ， 我 们 能 有 效 地 运用 更 篇 程 度 
(АЮ) KAHT: RERA Alpha 有 2 个 整数 和 32 个 浮 点 寄存 器 。 正 如 这 个 岗子 说 明 的 那 祥 ， 程 
序 优化 的 通用 原则 对 各 种 不 同 的 机 器 都 适用 ， 即 使 某 种 特殊 的 特性 组 合 会 导致 最 优 性 能 依 豆 于 特殊 
ШІЛЕСЕ 


combinel 未 羽化 的 抽象 的 
combinel Th 3 E -o2 
combine2 HR vec length 
cembine3 ES V i 


ccmbine4 VPE ЗР rh 
combines ЕЛ x á 
, IT X 16 

combinef 354 | 展开 x4， 并 行 %2 

展开 X8， 并 行 XX4 

ЖЕЛ ХЕ, ЖЇТХВ 





528 ”所 有 合并 函数 运行 在 Compaq Alpha 21164 处 理 器 上 的 结果 比较 
同样 的 通用 优化 技术 在 这 种 机 器 上 也 有 用 。 
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5.12 ФАН АК 


ЕП {ТЕГ ЛД АЈ, БИКЕ EAI ЗЧ ВОВ 2 ВИНЕ ІЛЕТІН, ЛЕА ТТЕ, 
FRITES, ИШЕТЕП ВЕ ТЕ Fj Arfr2 384, BEIGE RÀ АИЛЕ, ЯД 
48 “ЖА Қ, Cinstruction pipeline) ЗВЕНЕ. ЖЧ. ЗАУЗА, ДЕЕ АЧИ 
Л АЕ. ЕЕЕ АЯ, АЕ ЕДИ E razi PE sy. FRR ОЖ 
像 我 们 在 代码 中 看 到 的 ， 跳 转 到 由 ТИЕ ЖЕНЕ ЕЛЕН) 或 过 程 返回 这 样 的 指令 ， 这 意味 着 
Ww Hm. САН. RETER. 

f. 个 使 用 投机 执行 (speculative execution) ЖЕ h, АЯ nI ЙІН С H Ж 
ЖН?» БАРКЕН ЈЕ, Ж ЖЕГЕН НА Fan toba B, B ЖЇН = ГЕК ША Ж. 
ПЖ РАЙ БЕЙ), ЖЕЛЕДЕН ЙН E Mh “e se" ВЕНА НЕ ААН, Eh ЖЕНТ E 
Ap. ARMA ЕН, АНЫЙЯ ХИМИЯ ЖИТ ЕН E. ЖЕКЕШЕ, OM OHP HORN 
令 的 过 程 。 这样 做 会 引起 很 大 的 分 支 处 罚 〈branch penalty})， 因 为 在 产生 有 用 的 结果 之 前 ， ОЛ 
填充 指令 流水 线 ， 

下 到 最 近 ， 葡 等 投 机 执行 所 需 的 技术 部 被 认为 是 开销 太 大 ， 对 除了 最 高 级 的 超级 计算 机 以 外 的 
所 有 机 器 来 说 都 是 异乎 寻 芝 的。 不 过 上 估 约 从 1998 年 开始 ， 集 成 电路 技术 使 得 串 以 在 一 坎 芯 片上 放置 
好 虑 之 多 的 电路 ， 以 全 于 有 些 电 路 可 以 专门 用 来 支持 分 支 预测 和 投机 执行 。 到 日 前 ， 台 式 机 或 服务 
钱 中 几乎 每 个 处 理 器 都 支持 氟 机 执行 ， 

在 优化 我 们 的 人 台 并 过 程 中 ， 我 们 没有 看 到 循环 结构 对 性 能 的 任何 限制 。 也 台 是 ， 看 上 去 对 性 能 
惟一 的 限制 因素 是 由 于 已 能 单元 。 对 于 这 个 过 程 处 理 ， 处 理 器 通常 能 够 预测 循环 结尾 处 的 分 支 的 方 
同 。 实 际 上 ， 如 淋 处 理 器 总 是 预测 会 选择 分 支 ， 那 么 除了 对 最 后 一 次 迭代 以 外 ， 它 者 是 对 的 。 

人 人 们 已 经 提出 了 许多 方法 来 预测 分 支 ， 和 而 且 对 这 些 方法 的 性 能 也 进行 了 很 多 研究 。 一 种 常见 的 
书 发 式 方法 是 预测 任意 到 较 低 地 址 的 分 支 都 会 被 选择 ， 而 任何 到 较 高 地 址 的 分 支 则 不 会 。 到 较 低 地 
址 的 分 支 基 用 来 关闭 循环 的 ， 因 为 循环 通常 会 执行 多 次 ， 预 测 这 些 分 支 会 被 选择 是 个 好 主意 。 另 一 
ЛШ, 前 同 分 区 是 用 于 条 性 叶 算 的 。 实 扒 表 明 后 问 选择 、 前 向 不 选择 的 启发 式 方法 在 大 约 的 多 的 时 
站 里 是 正确 的 ， 向 预测 所 有 的 分 支 都 会 被 选择 的 成 功率 只 为 大约 606. ВАНЯ, ЖЕ 
ЕМЕ. ИП, Intel Pentium H 和 IU 处 理 器 使 用 的 分 支 预测 策略 声称 在 90959590 Т Ж 
ДЕ) a 

34] 10] EA REIT SCUSCROMJ LA AER IR PA 7 ЖО FRE 8E У, ELE TURIS EG ӘЛІНІҢ 5.29 中 所 
示 的 绝对 全 图 数 作 为 我 们 的 测试 示例 。 这 幅 图 还 给 出 了 编译 后 的 形式 。 对 于 非 负 的 参数 ， 分 支 会 被 
АЖ, EDDA NE. WADE 个 数组 中 每 个 元 素 绝对 值 的 半数 计时 ， 这 个 数组 是 
由 +] 和 和 -1 的 各 种 模式 组 成 的 。 对 于 规则 的 模式 (例如 ， 全 +1、 全 -1 UE EBD, SU PAESI 
457558 13.01 —13.41 个 周期 我 们 以 此 作为 我 们 完美 分 支 条 件 下 性 能 的 估计 值 。 对 于 “个 设置 为 
+] 和 -1 和 随机 模式 的 数组 ， 我 们 发 现 嘎 数 需要 20.32 个 周 斯。 随机 处 理 的 一 个 原则 是 克 论 用 什么 策 
略 来 荡 测 值 的 序列 ,如果 底层 的 处 理 是 真正 随机 的 ,那么 我 们 只 可 能 有 50 锡 的 时 间 是 正确 的 。 例 如 ， 
无 论 一 个 人 用 什么 策略 来 猜 扔 硬币 的 结果 ， 只 昔 扔 硕 币 是 公平 的 ， 成 功 的 概率 就 只 能 是 和 5。 因 而 ， 
我 们 可 以 看 到 ， 这 个 处 理 器 预测 错误 的 分 支 会 引起 大约 ва 个 时 钟 周期 钓 处 罚 ， 因 为 50%іК ІН 


误 率 会 导致 国 数 运行 平均 慢 ? 个 周期 。 意 思 就 是 说 ， 对 absval 的 调用 依据 分 支 预 测 的 成 功率 ， 需 要 
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13-27 个 周期 。 
code/opvabsval.c 
1 int absvalíint val) 
2 [ 
3 return (удісй) ? -val : val; 
4 } 
code/opt/absval.c 
(a) C 代码 
l absval: 
2 pushl %ebp 
3 movl Февр, %ерр 
4 movl 8(&ebp),*€eax Get val 
5 testi %еах,%вах Test ii 
б ісе .L3 ff >Ü, goto end 
Г negl %еах Else, negate it 
B „1,3; end: 
9 movl tebg, tesp 
10 рорі $ebp 
11 ret 
(b) I ed 
图 5.29 ”绝对 值 代码 


我 们 用 这 段 代码 来 测量 分 支 预 铀 错误 的 作价。 


14 个 周期 的 处 冲 是 相当 大 的 。 例 如， 如 果 我 们 的 预 济 准 确 率 只 有 6595. EA ON SEPT XB 
处 理 器 平均 会 浪费 14X0.35=4.9 周期 。 即 使 是 Pentium ПЖ III 声称 的 预 济 准 确 率 是 90%--95%, BH 
于 预测 销 误 ， 每 个 分 文 都 会 浪费 大 约 工 个 周期 。 对 实际 程序 的 研究 表明 ， 在 典型 的 “整数 ”程序 (也 
WAR. Ж ИЕЛ АИ Л ЕНЕН) 中 ， 分 支 大 约 占 到 了 所 有 执行 指令 的 59. flc NE 
FP, GAEE 3 名 一 12 况 [33j， 因 此 ， 由 于 低 效率 的 分 支 处 理 造 成 的 任何 时 间 浪 费 都 能 对 处 理 
器 性 能 产生 很 大 的 影响 ， 

证 多 与 数据 相关 的 分 支 是 根本 不 能 预测 的 。 例 如 ， 小 有 任何 依据 猜测 我 们 移 对 值 明 数 的 一 个 参 
状 是 正 数 还 是 负数 。 为 了 提高 包括 条 件 求 值 代码 的 性 能 ， 许 多 处 理 器 设计 被 扩展 来 包括 条 人 忻 传送 
(conditional move) 指令 。 这 些 指 令 多 许 某 些 形 式 的 条 件 句 不 需要 任何 分 支 语句 就 能 实现 。 

{E 1A32 指令 集中 ,从 PentiumPro 开始 增加 了 许多 不 同 的 cmov 指令 。 最 近 所 有 的 Intel 和 与 Intel 
兼容 的 处 理 器 都 支持 这 些 指 令 ， 它 人 科 执 行 的 各 作 类 伺 于 CC КІШ. 

if (COND) 

£ = YI 

XE y 是 源 操作 数 , х НЕЕ. 0 COND 确定 是 否 要 执行 拷贝 操作 ， 它 是 基于 条 件 
码 值 的 某 种 组 合 的 ， 类 似 于 测试 和 条 人 忻 转 移 指 令 ，。 作 为 一 个 示例 ， 当 条 件 码 表明 一 个 值 小 于 00, 
cmovll 指令 执行 一 个 拷贝 。 注 意 ， 这 条 指令 的 第 一 个 ”表示 “less (小于)”， 而 第 二 个 “1” 是 
GAS XR KE ESTE ZR 
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КШ AS ACER Rs ГТ ЖТТ ПЕ ЖАСА АНЫ; 


1 movl &{(%ерр},%еах Get val as result 

2 тоу peax, tedy Copy to %ейх 

3 negl %едх Negate Фейк 

4 testl Жеах,%сах Test val 

5 Conditionally move Teds to Зоеах 

б cmovll %edx,*eax If < 0, copy %edx to result 


ПЕ Br VB den АД р, ЖЕДЕ val Б ИНА, Е -val， 并 当 val 为 负 时 ， 行 条 件 地 
将 它 传 送 到 寄存 器 各 eax 以 改变 返回 值 。 我 们 对 这 段 伐 码 的 测试 表明 无 论 数 据 模 式 昵 梓 ， 它 邵 运 行 
13.7 个 周期 ， 语 下 体 性 能 明显 地 好 于 和 需要 13—27 个 周期 的 过 程 。 


练习 题 5.7 

们 的 一 个 朋友 写 了 一 个 利用 杀 件 传送 指令 的 优化 编译 器 。 你 试 着 编译 下 面前 口 代 码 : 
1 /* Dereference pointer or return Ü if null */ 
2 int derefiint *хЕ) 

3 i 

4 return хр ? *xp : ©; 

5 


| 
编译 器 为 过 程 体 产 生 下 面 的 代码 ， 


l movl БіФебрі,%ейх Get хр 

2 movi ІЗегхі,Жеах Get *xp as result 

3 Les-l Фейх, yeda Test хр 

4 cmovll €edx,*eax if 0, сору 010 result 


解释 一 下 为 什么 这 段 代码 提供 的 不 是 derf 的 合法 实现 。 


GCC ПАЛУАН ЕЛА ЖРО Е ЕНИ. У АТВ 486 和 Pentium 处 理 器 性 
ЕЖ ЕЕ АІ ЕЖ. 在 我 们 的 试验 中 ， 我 们 使 用 的 是 上 而 所 示 的 手写 的 并 - 编 代 二 。 
出 于 代码 生成 的 质量 更 糟 癌 ， 一 个 使 用 GCC T R£ C HT NUES LARES 17.1 个 周 
ИД. 

不 辛 的 是 ，C 称 序 员 对 改进 一 个 程序 的 分 支 性 能 是 万 能 为 力 的 ， 除 了 意识 到 数据 相关 的 分 支 会 
J 起 性 能 上 很 噩 的 花费 。 除 此 之 外 ， 程 序 员 对 编译 器 产生 的 详细 的 分 支 结 构 几 乎 没有 什么 控制 ， 很 
准 使 分 克 更 容易 预测 一 些 。 最 终 ， 我 们 必须 依靠 两 种 因素 的 结合 : 一 基 编 详 器 牛 成 好 的 代码 ， 尽 量 
研 少 条件 分 支 的 使 用 ， 男 一 个 是 处 理 器 有 效 地 分 支 预 测 ， 降 低 分 支 珊 测 错误 的 数量 。 


513 理解 存储 器 性 能 

到 [前 为 下 我 们 与 的 所 有 代码 ， 以 及 我 们 运行 的 所 有 测试 ， 对 存 储 器 的 需求 部 相对 较 少 。 例 如 ， 
STEP RETE SE А 1024 的 向 量 上 测试 那些 合并 函数 ， 数 据 量 不 会 超过 8096 字 节 。 所 有 的 现代 处 理 
器 都 包含 “个 或 多 个 高 速 缓存 (cache) 存储 器 ， 以 提供 对 这 样 少量 的 存储 器 的 快速 访问 。 图 5.12 
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"d EUR ШИЕ Sp ik a а ЕН P ЕНЕТІН. ТЕ о, RZE ERARA ЫЕ 
存 是 如 和 何 上 作 的 ， 以 受 如 何 编写 充分 利用 商 速 缓存 的 代码 。 

在 东 节 中 ， 我 们 会 进一步 研究 加 载 和 存 储 操作 的 性 能 ， 我 们 仍然 假设 被 读 或 号 的 煞 撕 是 在 起 速 
缓存 中 的 。 如 图 5.12 所 示 ， 这 两 个 单元 的 执行 时 间 都 为 3， 而 发 射 时 间 为 1。 迄 今 为 小 我 们 的 所 有 
程序 都 只 用 了 了 加载 操 作 ， 都 有 这 样 一 个 属性 ， 一 条 加 载 操 作 的 地 址 恢 束 于 对 某 个 寄存 器 执行 增加 操 
作 ， 而 不 是 恢 赖 于 另 一 条 加 载 操作 的 结果 。 因 此 ， 如 图 s. 15— 5.18. 0 5.21 Ж 526 Bron, JW 
栽 操作 能 利用 流水 线 化 ， 每 个 时 钟 周期 开始 新 的 加 载 操 作 。 加 载 操 作 相亲 较 长 的 执行 时 间 对 程序 性 
能 没有 任何 负面 影响 ， 


5.13.1 加 载 的 执行 时 间 

作为 一 个 性 能 受 如 载 抬 作 执行 时 间 限 制 的 代码 示例 ， 兰 虑 图 数 ist len, infi 52057. ҒИ 
数 计算 的 是 -个 链表 的 长 度 . 在 该 荔 数 的 御 环 中 ,变量 15 的 每 个 连续 的 值 都 依 束 十 指针 引用 15-отехі 
读 出 的 值 . 我 们 的 测试 表明 函数 list_len 的 СРЕ 5 3.0, RINM Эд REPEAT RR АК БІ. 
为 了 说 明 这 一 点 ， 来 者 虐 庆 个 御 环 的 汇编 代码 ， 以 及 它 的 第 一 次 迭代 到 操作 的 翻译 ， 


MB 





127; 

incl Рах incl едх. 0 

movl (%еах},%едх load (Жепх, 0) 

кесі! Фейх, %епх testi Жесік.1,%ейх.1 

ne .12" jne-taken сс, ] 

code/opt/list.c 
1 typedef struct ELE { 
2 struct ELE *next; 
3 int data; 
4 } list ele, *list ptr; 
5 
6 int list, lení(list ptr ls} 
f { 
В int len = 0; 
9 
li for {; ls; ls = ls-»next) 
11 ]en4-4; 
12 return len; 
13 } 
coderoptHlist.e 


图 5.30 HRAN 
这 举例 说 明了 加载 操 作 的 执行 时 间 。 


寡 生 器 和 edx 的 等 个 迹 续 的 值 都 依赖 于 一 个 以 驳 edx ТЕЗЕ on Be E ШЕЕ. B| 5.3] 给 出 的 
芷 这 个 中 狼 头 三 雇 适 代 的 操作 的 调度 。 正 如 看 到 的 那样 ， 专 载 操 作 的 执行 时 间 将 СРЕ 限制 在 了 3.0. 


366 


%5% 





Заах.3 


4 ' te 
DIG: 
n l-t load 


m 

Вт r 
; e) 
8 UB i-i 
9 Кд 3 
10 testi 
11 12 

ЖАК 3 


图 5.51 链 直 长 度 函 数 的 操作 的 调度 


加 载 操 作 的 执行 时 间 特 CPE 的 最 小 慎 限 制 在 了 3.0。 


5132 ”存储 的 执行 了 时间 

在 做 令 为 止 我 们 所 有 的 示例 中 ， 我 们 只 通过 使 用 加 载 操 作 从 一 个 存储 器 空置 读数 据 到 一 个 帘 存 
器 中 来 与 存 以 器 交 豆 。 与 之 对 应 的 存储 (sure) 操作 将 -个 寄存 器 值 写 到 存 赃 器 。 目 如 咖 5.12 下 
由 的 那 梓 ， 这 个 操作 名义 上 的 执行 时 间 也 是 三 个 周期 ， 发 射 时 间 为 一 个 周期 不 过 ， 它 的 行为 以 及 
它 与 加载 操作 的 奕 女 有 几 个 微妙 的 问题 。 


со =] Cà АП ҥ= Ü М) ғә 


M 





code/opl/copy.c 
/* Set element of array to Ü */ 
void array cleart(int *src, int *dest, int n! 


{ 
nt `; 
for {1 = 0; i < n; i++) 
dest[1] = 0; 
} 


/* Set elements of array to 0, unrolling by 8 */ 
void array clear B;int *src, int *dest, int пі 
{ 

int 1; 

int len = n - 7; 
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15 [ог (1 = 0; i < len; l+=8) 1 
17 dest[il = 0; 
18 dest[i«1) = 0; 
19 dest [1+2] = 0; 
20 dest [1+3] = 0; 
21 дев [1+4] = 0; 
22 desr[i45] = 0; 
23 деят [1+6] = 0; 
24 dest[i47] = 0; 
2 5 } 
25 for (; í < n; i++} 
27 dest{il = 0; 
28 } 
一 一 一 一 -一 一 一 一 一 一 U code/opticopy.c 
532 Жена 
ЖАН Y dede BE BOLA ER IA. 


ЛИЕВ, dE S be h, ТИНЕ ИГЕ ЕНІ МЕМ ТТЕ, STADT 
始 一 条 新 的 存 鳍 。 例如 ， 考 虚 图 5.32 中 所 示 的 函数 ， 它 们 将 一 个 长 度 为 n 的 数组 dest 的 元 素 设 置 为 
0。 我 们 对 这 第 一 个 版 本 的 测试 表明 CPE 为 200. 因为 每 次 迭代 都 需要 一 个 存储 操作 ， 所 以 很 明显 
处 理 器 至 少 每 2 个 周期 能 够 开始 -一 条 新 的 存 情操 作 。 为 了 进一步 探究 , 我 们 试 着 腻 开 这 个 循环 八 次 ， 
如 array clear 8 的 代码 所 示 。 对 于 这 个 函数 ， 我 们 测量 得 到 СРЕ 1.25， 也 就 是 ， 每 次 迁 代 需要 大 约 
10 个 周期 ， 并 发 射 8 个 存储 操作 。 因此, 我 们 几乎 已 经 达到 等 个 周期 一 条 新 存储 操作 的 最 优 极限 了 ， 

同 到 日 前 为 出 我 们 己 经 着 虚 过 的 其 他 操作 不 同 ， 存 储 操 作 并 不 影响 任何 寄存 器 值 。 因 此 ， 碱 其 
本 性 来 说 ， 一 系列 存储 村 作 -- 定 是 相互 独立 的 。 实 际 上 ， 只 有 一 条 加 载 操作 是 受 一 条 存储 操作 缩 采 
影响 的 ， 因 为 只 有 -- 条 加 载 操作 能 从 由 存 迟 操作 写 的 那个 存储 器 位 置 读 回 值 。 图 5.33 所 示 的 国 数 
write read 说 明了 加 载 和 存储 操作 之 间 可 能 的 相互 影响 。 这 幅 图 也 展示 了 该 盘 数 的 棒 个 示例 执行 ， 
是 对 两 元 素数 组 a 调用 的 ， 访 数组 的 初始 内 容 为 -10 和 17， 参 数 см 等 于 3。 这 些 执行 说 明了 栅 载 和 
存储 换 作 的 一 些 徽 隶 之 处 。 

在 图 5.33 的 示例 À 中， 参数 src 是 一 个 指向 数组 元 素 a[0] 的 指针 ， 而 dest £&— 7 8 PESCE 70 
a[1] 的 指针 。 在 此 种 情况 中 ， 指 针 引 用 *sre 的 每 次 加 载 都 会 得 到 值 -10。 因 此 ， 在 两 次 达 代 之 后 ， 数 
组 元 素 蜀 会 分 别 保持 固定 为 -10 和 -9。 从 sre 读 出 的 结果 不 受 对 det B) BR, TESCO 
代 上 测试 这 个 示例 得 到 CPE 2.00. 

在 图 5.33 (а) 的 示例 B 中 ， 参 数 src 和 dest 都 是 指向 数组 元 素 a[0] 的 指针 。 在 此 种 情况 中 ， 指 
针 引 用 *src 的 每 次 加 载 部 会 得 到 指针 引用 *dest 的 前 次 执行 存储 的 值 。 因 而 ， 一 系列 不 新 增加 的 值 公 
被 存储 在 这 个 位 置 。 通 常 ， 如 果 调 用 疼 数 write, read 时 参数 src 和 dest 指向 同 一 个 存储 器 位 置 ， 而 
参数 ent 的 值 为 wm>0， 那 么 净 效 果 是 将 这 个 位 置 设 置 为 上 1。 这 个 示 鲍 赔 明 了 一 个 现象 ， 我 们 称 . 之 为 
写 / 读 相关 【write/jread dependency) 一 一 一 个 存储 器 读 的 结果 惰 束 于 一 -个 非常 近 的 存储 器 号 。 我 们 
的 性 能 测试 表明 示 恬 B 的 CPE 为 6.00。 写 / 读 相 关 导 致 处 理 速度 的 下 降 ， 


code/opt/copy.c 
1 /* Write to dest, read from src */ 
2 void write_readiíiint *src, int *dest, int п) 


368 # 5% 


3 | 

4 int сай = n; 

5 int val = 0; 

5 

7 while (спі -) 1 

H *dest = vcl; 

Э vài = (*srcl-«l: 
10 } 

11 } 


-—————— eo0de/ant/copy.c 


dl А: write reacika[) ,&а[1],3! 





图 5.33 ”与 和 读 存 储 器 位 置 的 代码 以 及 示 齐 执行 
这 个 太 数 强 油 的 是 当 套数 ыс 和 dest ИЗИН. TRAWERS ШИНЕ Sma, 


为 了 了 解 处 理 器 是 如 全 区 划 这 两 种 情况 的 ， 以 及 为 什么 一 种 情况 比 另 一 种 运行 得 慢 ， 我 们 必须 
更 加 仔 纲 地 看 看 加 载 和 存 情 执行 单元 , 0 5.34 9. НАЛЫ АЖА store buffer), 
它 包 舍 已 经 被 发 射 到 存储 单元 而 及 还 没有 完成 存 情 操作 的 地 址 和 数据 ， 这 里 的 完成 包括 更 新 数据 启 
速 缓存 。 提 供 这 样 个 缓冲 区 ， 使 得 一 系列 存储 操作 不 必 等 待 每 个 操作 更 新 总 速 缓存 就 能 够 执行 ， 
ЛЕТЕ Б Е, ЕА ТТЕР ЕВН, ВАЕН АЕ. ЯСНЕЕ НЕЕ 
配 ， 它 就 本 出 相应 的 数据 条 目 作 为 加载 操作 的 结果 。 

其 中 内 循环 的 汇编 代码 和 它 的 第 次 类 人 到 操作 的 翻译 如 上 所 悄 : 


сі жебсіх, i tecx) sblorgaddr (*ecx] 

storedata Y*edx.Ü 
movi ІЖеБЕх), епу load (*ebx! &£odx.la 
inci Фейх inc. &$edx.la tedx. 1p 


сес] $eax decl eaX.(ü ieax.l 





іпс .Һ32 inc-takez сс.1 


Т ВЕ 359 





Ж 554 加 载 和 存储 单元 的 崩 带 
ИС ГТО ИТЕРЕ. ШИ АЮ ИЕНА Е p at ПТ. 


我 们 看 到 ， 这 里 movl Фейх, (&ecx) ШЕТЕН IM TTE: aoceaddr fi SERE EORR ETT HU RE. 
Bis — T- ЕЛ ЖН. Hi Wi 3 F МИНЕ, storedata R EN IRR HIS EE, 
因为 内 有 一 个 存 彤 单元 , ПЕШКЕ ЖЕН ЛЕШЕ). ШЫН W Php e HR EE HE Ж Bl. 
КАП Ж ЕРЕ. АУН И АЈ ET JE M u a qe Р! ЕЕЕ R ABP ИЕ 1р OR. 

Ң 5.35 给 出 了 对 于 示例 A [К И. write тем HAAAT EE. WH storeaddr 和 load 
WR TEZ PaL] e ER RHET REPE. storeaddr 覃 作 创 建 一 个 存 赃 田 冲 区 中 的 条 有 日， 然后 юва 会 验 查 这 个 条 
Hd. ШАПАР ЕЕЕ ASS, 所 以 Toad ВАРЕНЕ НЕ ДА, FUR hE Ref IER EE 
We. ЕВИМИМЕЯЕЛЕНІҒЕ er C SET AR IE UC EE W - CI Ip a ИА 
HP. АЁ. WAWER storedata КЕЗ, AAWA T Wi is k. ERLEBT 
RA. storeaddr HIER load RIFT UL НЕГЕ TOS A b Es dg e]. ir] SP RI. ЕЛРІШН 
ERENT. ЕНИП ИШ. RETA- AARET- AARRE 1 个 周明 开始 
Air. ШЖК ЖЕК. ПАН СІНЕН СРЕ Ж 10. HE. Xi ibi) mE 
HEETE RATE T CPE 10 L. 

B] 5.36 TATRA B ARR. write read HLR EMED FAFA аогеаййг 和 
Кай fi: Z7 [8] Eh] ШЕ K B], storeaddr ЕРЕ АЕ РВЕЗЕ AA. E load Sets EB. 
о H ИЕ Hg. ИТП ЗН. FCRI storedata 操作 完成 ， 然 后 它 再 从 存 铺 规 冲 区 中 
КИНЕ. 这 沾 等 桂 在 图 中 是 以 load AEMET Er gu. debes 我 们 展示 了 一 条 从 aaredata 
到 load ШТЕЙ ИШЕ Ж. СЕЗЕН woredala 85485 ЕКІН load 作为 它 的 关 果 ， 我 们 这 些 操 作 的 时 
HE DAMES СРЕ 为 各 0。 和 不过， 这 样 的 时 序 确 切 地 是 如 何 出 现 的 ， 还 平 是 完全 请 楚 ， 所 以 这 
此 图 内 是 示意 说 明 性 的 ,而 不 是 实际 的 。 通常 ， 和 处 理 器 /存储 器 接口 是 处 理 回 设计 中 最 加 如 的 部 分 之 
—. Tit iem m РЕНЕА АНТ СИ. RUCIRLRERE HUE 9 i56 1 Bo n Hl 

ШАМЫ ТН, МЕТІНЕ ІН ЕЛШЕ ЕИ. TW WW. ЕҢ HIDE 
жен, = гй НІНЕ ME НІНЕН», S chili, HET HERI [或 内 存 ) ME, 








3/0 $53 
"ЕДЖ F ЕДЕН ИЕН KA Bl, RETE SERE Be TUR ES СЕН ЭШИ. m Tris 
操作 占 到 了 程序 很 大 的 一 部 分 ， 存 储 器 子 系 统 被 优化 成 以 独立 的 存储 器 操作 来 提供 种 人 的 并 行 性 。 


ФЖаах. 0 
$edx.l 


周期 
T 





ik i2 
图 5.35 “对 示例 六 的 write read ЕРЕ 
TEAMWARE SIRE. DNE RI ЕН МЕНІ. 


вах.) 一 
tedx.0 


store E 
"| data Ë 


Ұғах.2 





load 


Ja] BH 


data 


едк. 24 


tedx 25 777 
Жі 2 
536 ЯТ В ме read ЕНІ? 
TERMER HEREA, ПЛ ЕН. BEST UDDDAESEXEDREERLT , 


кА I 371 


14 518 5.8 , 


Э Г е а tii n, Ж ЖЕН АН. EX—HÜOümeeT ER 
! void сару array[int *src, int *dest, int п] 

à | 

3 int i; 

à 

5 Far {1 = Dj i < nr i++} 

5 jdest|il] = srclil: 

7 | 


идал-ТтЕял ТО dii, cabeieith 3 E alil Т i. 

А. 调用 copy, array(as 1, a 9996] Ж T 

B. 调用 copy тауа, a+l, 99968 AX 3 TT 7 

C. Aeg d ЕД Г 入 调用 的 CPE 为 3.00, 而 问题 BB 调用 的 CPE Ж 5.00. БАЯН 
x H4 ds Тн d Я" 

D. 调用 copy штауіп, а, 999i] ti Е Ead? 


5.14 现实 生活 : 性 能 提高 技术 


里 热 我 们 只 考虑 了 有 限 的 一 组 虚 用 程序 ， 但 是 我 们 施 得 出 基于 如 何 贝 写 高 获 民 码 阐 很 重要 的 经 
Wr. AIEEE ГЕРЕ ВЕЗЕ RES 
1. Sgt. ЖЕШИНЕ: мик. ЕНШІ, E ТЕНЕ E 
ШЕТЕН Ж. 
2% лшылы, E ACEP RK, АРАН ИЕГЕ ЕЕН. 
. ilm. оын, ЖИЕ ЕЕ. ЖТАНТЕРЕНННЯНЕЫ 
获得 更 大 的 效率 ， 
. 广 除 不 必要 的 存 博 器 引用 。 引 入 临时 变量 来 保存 中 间 结 黑 。 只 有 在 最 后 的 怕 计 算出 来 时 ， 
ИНК ЕН Phim ki. 
3, f e pom. 
ТЕН ИНОН n IHE TEST. 
s ELURTE. 
“ iifdem ok. He gem ac EPIS CB E. 
guis dits qot tf ARENAER. -ШЯНІтЕЖЕ, TET 
ЖАНЕ ERI ЕНІН (checking code? 来 测试 代码 的 每 个 版 本 ， 以 确 怪 在 不 一 过 程 中 没有 引信 司 
误 ， 检 查 代码 将 一 系列 届 试 应 用 到 程序 上 ， 确 保 它 得 到 期 望 的 鳍 果 。 当 引入 新 的 变量 ， 改 变 精 臣 这 
界 ， 以 及 使 代码 塌 体 更 复杂 时 ， 很 容易 出 错 。 此 外 ， 注 意 列 性 能 上 尾 何 不同 寻常 的 或 出 平坦 料 的 变 
化 是 狠 重 要 的 。 正 如 我 们 已 经 表明 的 尿 样 ， 由 于 性 能 异常 ， 基 准 数据 的 选择 能 够 在 性 能 比较 中 造成 
iR. PHELPS E dl IRR. 
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5.15 ”确认 和 消除 性 能 瓶颈 


到 此 刻 为 上 上 ， 我 们 只 和 兰 虑 了 优化 小 的 程序 ， 在 这 冬 的 小 程序 中 ， 幅 昌 优 化 的 地 方 很 清楚 。 华 处 
奸 大 程序 时 ， на РЕАЛА ИГА. tp. И А S 8 Н) HUBS ЖЕЛ (code 
profilers), ХЕЙЕРНДІНІҢ Ж ТЕНЕ ЛГЕН. ЯНЕ ВА -ARAE Н А ШІ), 
ff Amdahl 定律 CAmdahl's Jaw). 


5.15.1 程序 剂 析 

ТЕЛЕН Cprofiling) 包括 运行 程序 的 这 样 一 个 版 本 ， 其 中 插入 了 工 其 代 的 ， 以 确定 称 序 的 阁 
个 部 分 需要 多 少时 间 。 确 认 出 程序 中 我 们 泪 要 集中 注意 崩 优 化 芍 部 分 是 很 有 用 的 。 前 析 的 - HT B DJ 
之 处 在 于 可 以 MERER (benchmark data) 上 运行 实际 的 程序 ， 一 这 进行 剖析 。 

Unix 系统 提供 三 -个 剖析 程序 GPROF。 这 个 种 序 产生 两 种 形式 的 信息 。 首 先 ， 它 人 确定 程序 中 
ЖЛ ЕНЕ Т Eib CPU ВВ]. 其 次 ， 它 计算 每 个 函数 被 调用 的 次 数 ， 以 调用 前 数 来 分 关 。 这 井村 
形式 的 合 息 痢 非 常 有 用 。 这 些 计时 给 出 了 不 同 函数 在 确定 上 整体 运行 时 间 中 的 相对 重要 性 。 调 几 信 息 
БИН ИГЕ EE FP LAE АС. 

用 GPROF Bir Bb ҮОЖ, РТА C ET proge 邦 样 ， 它 运行 时 命令 行 参数 为 
file.txt: 

1. BRA T ЖИЛЕ. ӨЛІ ОСС CELA Rb C #0, MET a ITL BI 8.3149 
Heir тн “ -pg ”。 

ыпіх> gcc -22 -pg prog.c -o prog 

2. BERE EA: 

unix» ./prog file.txt 

Qf ШЕ BR да, ЛОВОРОВ ЕЛЕ Г ЗС gmon.out. 

3, 调用 GPROF ЖГ отоп ош HARE. 


unix- gprofí prog 


ЗАТЕ P SS a8 PUE DTE TISSUES MIRI, ШЕ ИҢЕ. ВЕ omi). Fm, 
А ТАРАА Д, 2 6383 8 Ы 


% cumulative sell self total 
timg seconds Seconds calls ma/call ms3/call name 
55,52 7,8 БЕЛІ 1 1800.00 7800.06 sort words 
6.58 3.40 2,80 946596 2,00 0,00 find ele кес 
4.50 8,81 2.41 946596 0.00 0.00  loweri 


ERENER RUAA AA BHESUE а]. 35 АЕ ЛАТ ЕТ L gila) tr $ + 
ЕАС. 359 Sos Н BUE TT 2E ТРА Т HE ЖИЫН. 5 X ROO 
是 花费 在 这 个 函数 上 的 了 时间, Ж ETUR o PR ДЖ ИНЕ НАҚ (递归 调用 不 计算 在 肉 )。 在 我 们 的 
PUT P. AŽ sort words 只 被 调用 了 一 次 , 但 就 是 这 一 次 调用 需要 7.80 9. Й ІРІ мегі БН) T 
946 506 00, WETE 041 种 ， 


AIEE ТЕН Ew У ВА ТЯ И h. Ff E ТАНИ find, ele rec 的 历史 ， 
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4872758 find ele rec [5] 
0.60 0.01 9546596/946536 insert string {41 
[5] 5.7 0.60 0.0: 946596+4872758 find ele,rec [5] 


0,00 0.01 26946/26946 save string 195] 
0.00 0.00 26946/26946 new ele [11] 
4872758 find ele rec [5] 

这 个 历史 茎 显 水 了 调用 fid ele тес HAN, Tu Sog ТЕН. ALE barn BH 
发 现 这 个 图 数 实 际 上 被 调用 了 5 819 354 IX ERA 9465964872758") ——'5 П ЕМЕНІ T 4 872 758 
次 ， 而 函数 insert_string【 它 本 身 被 调用 了 946596 15) 调用 了 946596 iX. ЖШ find. ele rec КТ 
用 了 另外 两 个 图 类 save string 和 new ele, ST vg А Eae T 26946 次 。 

HREH a. REDE В ОТЕДИ ТН РЕЛЕ НЕ AES. Piin. ЖЖ nnd ele rec 
ЕНЕ, ЕН SEE. В ИЕ АТН, E EI MARWARE 5.15. 
我 们 可 以 推断 出 它 每 次 平均 大 约 需 要 扫描 6 个 元 素 。 

GPROF 有 些 属性 值得 注意 : 

* ”计时 不 是 很 准确 。 计 时 是 基于 一 个 简单 的 间隔 计数 (interyal counting) 机 制 的 ， 在 第 9 章 

会 讨论 这 个 问题 。 简 而 言 之 ,编译 过 的 程序 为 每 个 消 数 维护 个 计数 器 ， 记 录 花 费 在 执 
行 亡 阴 数 上 的 时 间 。 操 作 系 统 便 得 每 隐 某 个 规则 的 时 间 间 阳 5， 程 序 被 中 断 一 次 。5 的 典型 
ЛАВУ Еу 1.0 一 10.0 至 黎 。 当 中 断 发 生 时 ， 它 会 确定 程序 正在 执行 什么 前 数 ， 上 并 将 该 消 数 
的 计数 看 值 增加 5 当然， 也 9 能 这 个 孙 数 只 是 刚 开 始 执 行 ， 向 和 祖 快 就 会 完成 ， 却 赋 给 它 从 
上 次 中 断 以 来 整个 的 执行 化 费 。 在 两 次 中 疡 中 也 可 能 运行 其 他 某 个 程序 ， 却 因此 根本 没有 
计算 花费 ， 

对 于 运行 时 向 较 长 的 程序 ， 这 种 机 制 工作 得 相当 好 。 从 统计 上 来 说 ， 应 谈 根 据 北 费 在 执行 消 数 
二 的 相对 时 间 来 对 每 个 函数 计算 花费 。 不 过 ， 对 于 那些 运行 时 间 少 于 1 秒 的 程序 来 说 ， 得 到 的 统计 
СЕПТЕ ЛДЕ ЕЕ ЕНЕ» 

. ÜH А ЗЕ. 编译 过 的 程序 为 每 对 调用 者 和 被 调用 者 维护 一 个 计数 器 。 每 次 调用 - - 

TEN. Sens T. 
° MARR F, КЕЛЕ САО Н. FAHI HFAA КАЕ Т НВ 
数 的 次 数 中 ，。 


5.15.2 使 用 剂 析 程序 来 指导 忧 化 

作为 -个 用 剖析 程序 来 指导 程序 优化 的 示例 ， 我 们 创建 了 一 个 包括 几 个 不 同 任 务 和 数据 结构 的 
程序 ， 这 个 应 用 程序 读 一 个 文本 文件 ， 创 建 -- 张 互 不 相同 的 单词 和 每 个 单词 出 现 次 数 的 表 ， 然 后 接 
КН ЕТ ЛАГЕРЕ. ТЕН, ЖЫ -个 由 莎士比亚 合集 组 成 的 文件 上 运行 这 个 
程序 。 据 此 ， 我 们 确定 东 士 比 亚 - - 共 写 了 946 596 个 单词 ， 其 中 26946 是 互 不 相同 的 。 最 常见 的 单 
lj: "the", BM Г 298012X. Uis] "love" HJG 7 2249 次 ， 而 “deatbh” 出 现 了 933 IX. 

我 们 的 程序 是 由 十 列 部 分 组 成 的 。 我 们 创建 了 -系列 的 版 本 ， 从 各 部 分 简单 的 算法 开始 ， 然 后 
再 换 成 更 成 熟 完善 的 算法 ， 

.从 文件 中 读 出 每 个 单间 , 并 转换 成 小 写字 母 。 我 们 最 初 鸭 版 本 使 用 的 是 硝 数 lowerl (H 5.7), 
3, IDE E МЕНЕЕ САҚ. 
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2. ЯРНИ АУ е, Д-Т, 个 表 元 《buckets》 的 哈 希 表 产 生 一 个 07s 1 之 间 
的 数 宁 。 我 们 最 初 的 画 数 只 是 简单 地 对 字符 的 ASCII {ЧЫ ЖЕ, ША] ЖЖ. 

3. 每 个 险 希 才 元 都 组 织 成 一 个 链表 。 程序 洪 着 这 个 链表 扫描 ， 和 寻找 一 -个 比如 的 条 时。 如 果 找 到 
了 ,起 单 训 的 频 度 就 加 1。 否则 ， 就 创建 一 个 新 的 链表 元 素 。 我 们 晤 初 的 版 本 递归 地 完成 这 个 操 生 ， 
将 新 元 素 插 在 链表 尾部 ， 

4. 一 量 已 经 生成 了 这 张 志 , 我 们 虐 根 据 频 度 对 所 有 的 元 素 排 序 ,我 们 最 初 的 版 本 使 用 插入 排序 。 

图 5.37 给 出 了 我 们 的 单词 闲 度 分 析 程 序 各 个 版 本 的 剖析 结果 。 对 干 每 个 版 本 ， 我 们 将 时 间 分 为 
五 类 。 

Sort: 按照 频 度 对 单 训 排 序 ， 

List: АЛЫНА, ШЕШЕ. dA 个 新 的 元 素 ， 

Lower: 将 字符 吊 转换 为 小 写字 和 母 。 

Hash; 9. 

Rest; Em PE o ERI. 

如 图 中 (a) 部 分 所 示 , 我 们 最 初 的 版 本 需要 9 Б ВЕ, ИТЕ Е ОНЕР. BOX. 
因为 搬入 排序 有 二 次 复杂 度 ， 和 而 程序 对 27 000 个 值 进行 排序 。 

ERIT- МКТ, ЖЇН АЙ got 进行 排序 ， 这 个 图 数 足 基 于 快速 排序 算法 的 。 在 图 
中 这 个 版 本 称 为 “Quicksort”。 更 有 效 的 排序 算法 使 花 在 排序 上 的 寺 间 降低 到 可 以 忽略 不 计 ， 而 下 个 
运行 时 间 降 低 到 大 约 12%. 图 的 (h) 部 分 给 出 的 是 剩 下 各 个 版 本 的 时 间 ， 所 用 的 比例 能 使 我 们 看 
НЕЕ. 

ШЕ ГАЕТЕ, ИТЕ {ЖЮН RHS ERE T RIA. ЯНАҠМКИЖЕН ТИМ НА ІЗІНЕ 
Н), Н А ЕЕ ВЕТ, ШАА “Ше First”. А ТЕН, ЛЕН ШІ T K 1.8 
Ep. ЖАР HAWA (1 & АРАТ ЖАСО D] SARAKE ЖН А л. жй А. 
ЮЕ ЕШ. ПЕК ЕЕЕ БЕН. A PPP ХЕ. RUAHA ЖЕ EN] i HI 
ЕЕЕ ҒА АҢ-Ж, АҒАНЫ ж XU T. BEA ТА] HEC PU RESI] A, 
R MALAE Fa ЕЛУ 38, - КШ {ИКОН IRE BELT nus OB SD SMM AP SI, 
ЯС cr ROBUR] ИЙИЛЕ КЕҢЕ, dus ТАЛЫ. ERTER TH E 
BUM. ШЕЙ ЛЖ A ЛИ KE s. EHAE, шәл “Iter Last", MARET 
大 约 1.0 秒 ， 比 递归 版 本 稍微 好 一 -点 。 

接 下 来 ， 我 们 考虑 哈 希 表 的 结构 。 最 初 的 版 本 只 有 1021 个 表 元 (通常 ， 会 选择 表 元 的 个 数 为 素 
数 ， 以 增强 吗 希 函数 将 关键 字 均 匀 分 布 在 表 元 中 网 能 力 )， 对 于 一 个 有 26 946 个 条 日 的 表 来 说 ， 这 
ККА PIME Соай) 是 26 946/1007226.4. ЭЙЕ T МРАЯЖАЕНВЛИЕТАЛ ЕН 
作 上 上 了 一 一 搜索 包括 测试 估量 的 候选 单词 。 它 还 解释 了 为 什么 性 能 对 链表 脑 序 这 人 么 敏感 了， 因而， 
我 们 将 表 元 的 数量 增加 到 了 10007， 将 平均 负载 降低 到 了 2.70。 不 过 ， 很 奇 翌 的 是 ， 我 们 的 整体 运 
ATERRAT LILA. ЕЕЕ ДІНІНІҢ ЕЛДЕ Т АМЕН АРАН Е, MAT KC uT RE 
ЖӘНЕН. BB ЕГЕ r. ӘП АЕ BOXES NER МИЙ. 

SALA VCCE ALT fü TE ЛЕЙ EA AG АКАН АЛАН. ШЕЮ НЕТ ЖЖ BE S 
生 一 个 大 学 围 的 值 ， 也 不 能 根据 字符 的 分 类 做 出 区 分 。 例 如 ， 单 词 “god” 和 “dog” 都 会 哈 希 到 位 
下 147+157+144=448， 因 为 它们 包含 相同 的 字符 。 单 词 “foe” 也 会 哈 希 到 这 个 位 置 ， 因 为 
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l46+157+145=448, SEIT C Hip HE MPEG RE. Wb "Better 
Hash^. ЇЇ РЕ ИТ 084 £k. —T- hn FE ER] ini rao h, 
ШЖЕ КЕ TU e EE. XA dA OLET Т TER HUE, 








I 一 一 一 一 一 一 ч 
а — —— 
JE | | 
7 ——— —— — — —— — I 
ñ Б лл с 一- 
z | 
? 4 - 
Ü 3 
F- 
1 - | 
0 = Бі. | 
iber last Big table Bener hash — Linear kiwe 
(a) КЕГЕ 
2 — -一 一 =... 


СРО MEE 





(ho ЕГИН LU Ж 


В 5.37 ШЖ ЕЕ ET o ES I ES RI НЕН IE o АО EM A 9 n fn 

Ше. ЇЇ ЕТГЕН И T — titel n] TEE SERERE ЕТ. Са Ау A 8 
lowerl ЁТЕ ЕЕ, 特别 是 对 长 学 符 囊 来 说 , 这 篇 文档 中 的 单词 足够 短 ， 能 避免 二 次 性 能 (quadmatic 
performance) MKAN: 最 长 的 单词 C“honorificahiliudinitatihus > fg 27 个 字符 。 不 过 
БЕЛДЕН lower2， 显 示 为 “Linear Lower” 得 到 根 好 的 性 能 ， 加 个 时 间 隆 到 了 0.52 种 ， 

WETA 我 们 属 示 了 已 码 剖析 能 刍 帮 助 将 一 个 简单 庶 用 程序 所 需 的 时 间 从 9 11 各 降低 到 
0.52 БР--- ЕМ Г 17548. ЖШШЕ ПЕ ЕЛЕ РЕН ЛЫЙК ЕРИНИ E. БЕІН 
TAPAR WHAHA А. 

RIDGE mi ТАЖ ВАГА. dE EINE. ITM AK 
并 准确 ， 特 天 是 对 较 生 的 运行 时 间 [小 于 1 种 ) 来 说 ， 结 果 只 适用 于 被 测试 的 那些 特 焉 的 监 据 。 例 
滞 ， 如 要 我 们 在 由 较 洛 数量 的 较 长 字符 申 诅 成 的 数据 上 运行 最 刺 的 函 燥 ， 我 们 会 发 现 小 写字 母 转 换 
ВАЕ ЕЕЕ АИ. ИЕТ. з ОВЕ А ао Ч, АНТПЕ И А ИЕ 
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看 的 性 能 杀手 ， 例 如 lowerl 的 一 次 性 能 。 ЖЕҢ, БЕЗІНЕН ЕТЕТ ЖЕ ЕТТЕ, НИТЕ 
助 我 们 对 典型 的 情况 进行 优化 ， 但 是 我 们 还 应 该 确保 对 所 有 可 能 的 情况 ， 程 序 者 有 相当 的 性 能 。 这 
TOEURL SG 0 ЕЕЕ ЕВЕ (asymptotic performance? 的 算法 {例如 插入 算法 } ЖАК ЕЖ 
ФЕ СИТ lowerl?. 


5.15.3 Amdahl 定律 

Gene Атда! СИ SE Bist E37 —0 做 出 了 -e XT Im AME C BP FE ВЕНА R B9 fe] B. IH ДЕ 
ЕНМЕЛЕЛЕ, CC EO О Amdahl E. IEEE EAS АМАПА ЖЯ -- ВЮ 
ЖН. УЖ ИЕНЕН A ЛИК ТА FOR H ЖЕНЕН Ж». AEA AÓ. «ЕҢ 
中 执行 基 个 庶 用 程序 需要 时 间 Tuus R ИВ EI Y ЖАКЕ TTE А EE a, 向 我 们 将 它 的 
МАЕ a I kín. 也 就 是 ， 这 个 部 分 原来 需要 了 时间 eL. mm dm Ж ЕН (Тын. B. «YET 
行 时 间 会 是 


Тлек - (1 - a) Lu t (GT, Mk 
= Т, (1-а) + ark] 


据 此 ， 我 们 可 以 计算 加速 S= ТТА. А: 
сс 1 _ 
(1- a) ок 
АЗ, ЖАНЕ Bon. А K UH] 60918] (a-0.00 ПП ЛЖ ЕВ 3 fü 
(k=3), ЖАХИ E. 1Ң0.4-0.6/3151.67. 1916, BEER] A PR PE И Y RAAE. 
Se ESI Л ЖИ E M v. ЖЮ Ж Amdahl ЗЕФІНЕНДЛ--ЕНХИНИ ЕТ ЖАИЛЫ. Қ 
LP E 8 RI АЗЫ А o ЕПА. 
练习 是 5.9 
假设 你 的 职业 是 卡车 司机 , 称 被 航 全 运送 一 车 土豆 从 Idaho 的 Boise 到 Minnesota 的 Minneapolis, 
总 距离 为 2500 公里 . 你 估计 在 速度 限制 以 内 你 开车 的 平均 时 速 为 100 公里 , 整个 行程 需要 25 小时。 
А. TER DE UE, Montana AAEH TÈ AR, AARAA 1500 公里 。 你 的 卡车 可 以 开 到 
每 小 时 150 公里 。 你 这 次 行程 的 加 速 (speedup) 会 是 多 少 ? 
B. 你 可 以 在 www.fasttrucks.com 为 你 的 卡车 购买 一 个 新 的 泣 轮 增 压 器 .它们 有 许多 样式 ， 不 过 
想 开 得 越 快 ， 花 费 就 越 大 。 要 想 行程 加 速达 到 513， 你 必须 以 多 大 的 速度 通过 Montana? 
5) 5.10 
ҚММ ЕАГИ е) ЖР F — W 3 k e pata I, ECCE ST 3 EX TIGER 


表意 见 。 你 确定 只 能 改进 系统 ОЗЬ RAM. 为 了 法 到 整体 性 能 目标 ， 必 需要 将 这 个 部 分 提高 到 多 小 
(43k, K EM EE X EU)? 


(5.1) 


Атаа TER —- TB EC LESE e k Лен. ШАКЕ. 我们 能 够 取出 系统 的 某 
^N. Ж ЕШ И ЕЕН ШЖ ИЖЕ КЕ. MZ 482] 
2221 
` а-а) 
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因此 ， 人 和 例如， 如 时 我 们 能 够 将 系统 ФбООЮНИЯРЕНЕЕЗГЕКЕ BE WJ IPE 0, WARN 
的 净 增 速 岂 仍然 只 为 0.4=2.5。 当 我 们 用 快速 排序 取代 插入 排序 时 ， 从 我 们 的 字典 程序 中 就 能 看 出 
这 个 性 能 。 最 开始 的 版 本 花费 它 91 秒 中 的 7.8 秒 来 进行 插入 排序 ， 得 到 w=0.86。 使 用 快速 排序 ， 
忙 费 息 排序 上 的 时 间 变 得 可 以 忽略 不 计 ， 得 到 预测 的 增 速 为 7.1， 实 际 上 ， 实 际 的 增 速 要 高 -点 ， 
9.111.22=7.5， 这 是 由 于 对 官 始 版 本 的 剖析 测试 的 不 准确 性 造成 的 。 我 们 能 够 获得 大 的 增 速 ， 这 是 
因为 排序 鼎 到 了 整个 执行 时 间 的 一 个 非常 大 的 比例 ， 

Amdahl 定律 描述 了 一 个 改进 任何 过 程 的 通用 原则 .。 除了 适用 于 提高 计算 机 系统 的 速度 之 四, 它 
还 能 指导 一 个 公司 试 着 降低 生产 剃 须 刀 的 成 本 ， 或 是 指导 一 个 学 生 改进 他 成 好 的 平均 缚 点 。 或 许 它 
仕 计算 机 扯 界 里 最 有 意义 ， 在 计算 机 批 界 中 ， 我 们 通常 将 性 能 提高 一 售 眶 更 多 。 只 有 通过 优化 系统 
很 大 的 一 部 分 才能 获得 这 么 高 的 提高 率 ， 


5.16 ”小结 


盟 然 关于 生 码 优化 欧 大 多 数论 述 部 描述 了 编 详 器 是 如 何 能 生成 高 效 代码 的 ， 但 是 应 用 程序 员 有 
很 甸 方 法 米 协 助 编译 器 完成 这 项 任务 。 没 有 任何 编译 器 能 用 一 个 好 的 算法 或 数据 结构 代替 低 效率 的 
算法 战 数据 结构 ， 因 此 程序 设计 的 这 些 方 面 仍 然 应 该 是 程序 员 主 要 关心 的 。 我 们 还 看 到 妨碍 优化 的 
因素， 例如 存储 器 别名 和 过 程 调用 ， 严 重 限 制 了 编译 器 轨 行 估量 优化 的 能 力 。 同 样 ， 程 序 员 必 须 对 
消 际 这些 妨碍 优化 的 因素 负 证 要 的 责任 。 

除 比 之 外 ， 我 们 还 研究 了 一 系列 技术 ， 包 括 循环 展开 、 先 并 分 着 以 及 指针 运算 。 随 着 我 们 对 优 
化 的 深入 ， 研 究 汇 编 代 但 以 及 试 着 理解 机 器 旦 如 何 执行 计算 的 变 得 重要 起 来 。 对 于 现代 、 乱 序 处 型 
器 二 的 执行 ， 分 析 程 序 是 如 何在 有 雹 限 处 理 资源 但 是 功能 单元 的 执行 时 站 和 发 射 时 间 与 中标 处 理 器 
相符 的 机 器 上 执行 的 ， 收 获 良 和 多。 为 了 精练 这 个 分 析 ， 我 们 还 应 该 考虑 诸如 功能 单元 数量 和 类 型 这 
样 的 资源 约束 。 

包 全 条件 分 支 或 与 存储 器 系统 复杂 交互 的 程序 ， 比 我 们 首先 老 虚 的 简单 循环 程序 ， 更 加 难以 分 
入 和 优化 。 基 本 策略 是 使 循 不 更 容易 了 预测， 并 试 着 减少 存储 和 加 载 操 作 之 间 的 相互 影响 。 

当 处 理 人 时 程序 时 ， 将 我 们 的 注意 力 集 中 在 最 耗 时 的 部 分 变 得 很 重 监 。 代 码 剖析 程序 和 相关 的 
工具 能 帮助 我 们 系统 地 评价 和 改进 程序 性 能 。 我 们 描述 了 GPROF， 一 个 标准 的 Unis 剖析 上 具 , 也 
还 有 时 加 复 革 完善 的 剖析 程序 可 用 ， 例 如 Intel 的 VTUNE 程序 开发 系统 。 这些 工具 可 以 在 过 程 级 分 
和 解 执行 时 间 ， 测 量程 序 每 个 基本 块 (basic Моск) 的 性 能 。 其 本 块 是 没有 条 件 操 作 的 指令 序列 ， 

Amdahl 定律 提供 了 对 通过 只 改进 系统 -部 分 所 获得 的 性 能 收益 的 一 个 简单 但 是 很 厂 轧 的 看 法 ， 
收 蔓 既 恢 赖 于 我 们 对 这 个 部 分 的 提高 和 度 ， 也 依 闵 于 这 个 部 分 原来 在 整个 时 间 中 所 上 刁 的 比例 ， 


参考 文献 说 明 

有 许多 关于 编译 器 优化 技术 的 作品 。Muchnick 的 著作 被 认为 是 最 全 面 的 155]。 Wadleigh 和 
Crawford 的 关于 软件 优化 的 著作 [85] 包 含 了 一 些 我 们 已 经 谈 到 的 内 容 ， 不 过 它 还 描述 了 在 并 行 机 器 
АМАН aT. 

找 们 将 乱 序 处 理 器 的 拘 作 的 措 述 相当 简单 和 抽象 。 可 以 在 高 级 计算 机 体系 结构 教科 书 中 找到 对 
通用 原则 更 完整 多 描 述 ， 例 如 Hennessy 和 Patterson 的 著作 [33， 第 3 章 ]。Shriver 和 Smith 给 出 了 
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AMD Rb ЕРГЕН |09), AMD ЖЖ Ju ПШ ЖАНУ ЖЕ SERLO A. 
ХОЖА БИЕ ЕН НЕР I Amdah 定律 。Hennessy 和 Patterson АЧ [33-5 
Хә» К ЖЕЛ. ЖЕБЕ (xL ОН ИНЕ. 
zx Rt fe NE 
511 %Ф% 
ВБ BR S ТУЯР IEEE DL RE. IX EC] A HI РЕЖ АЖЕ АП ko SK TS hh 


A СРЕ 54. 通过 进行 与 我 们 将 抽象 combine l FRA ЕЖ Ж combined JE [8] ЖЕЛЕ, 我们 得 到 
Ш КІШ; 


1 ж Accumulate in temporary */ 


2 vold lnnerdíivec_ptr u, vec ptr v, data t *dest) 
3 1 

4 int 1; 

5 int length = vec_lengthiu): 

6 data, t *udata = get vec start'u]; 

7 data t *vdata = дес vec start|v); 

a data, t sum = (даса t) 9; 

9 

10) tor (i = ü; 1 < length; i++} í 

11 sum = sun + udata[il * vdatal[lil]: 
12 ) 

13 *dest = sum; 

13 |} 


3A RR лз TERNE. w ERA SES PORE 3.11 ЕКІ. For ЕЙ s F 
BF Лх: 


udata in Wesi, vdata in %ebx, i in Tedy, sum in Фесх, length in “edi 


1 124; іпор: 

2 movl (fesi, %ейх, 4}, Seax Get udatal i] 

3 1mull (*ebx,&edx,4),€teax Multiply Бу уда] 
d addl %еах,%есх Add 10 sum 

5 incl €edx itt 

Б cmpl жеді, едх Compare i;lengih 

7 ji .L24 if <, goto loop 


ERRERA E EB ERU НЕН ЖИТЬ fix ло ЕК ВТ. ЖЕЛКЕ (E--7 A6 
开始 之后 -个 周期 ，- :个 新 的 整数 据 作 СЕВ НАНЫН 就 能 开始 了 。 还 假设 整数 /分 去 功能 单元 
能 执行 简单 的 整数 氛 作 ， 

A, fix ИТ ВЕ ҮЕ УП BITE. movi 指令 翻译 成 一 条 load ВЕ, 寄存 器 免 eax ТЕ 
Н В ТИ К Ries FS BICI bea 1a Ai bear. Ib. 

B. ЖАБ НЕШ yk ТЕЕ FS RTL Ir МАҚ. 

C. ЖЖП АР ЖЫЛ ТАЕ {ЧУ CPE 最 好 也 只 能 为 25。 

D. ATF Ж, RIAR СРЕ 为 3.5. ЖЖЖ S SS. БЕНЕН ВР 
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ASOORA 3 个 周期 的 - -个 因素 ，。 


5.12 % 
编写 习题 5.11 中 描述 的 一 个 版 本 的 内 积 过 程 ， 使 用 四 次 循环 展开 。 


我 们 对 这 个 过程 的 测试 得 到 对 整数 数据 CPE 为 2.20, fX) 038 CPE 73 3.50. 


A， 解 释 为 什么 任何 厂 本 的 内 积 过 程 都 林 能 达到 比 2 更 大 的 CPE Т. 

B. 解释 为 什么 对 浮 点 数 的 性 能 不 能 通过 循环 展开 而 得 到 提高 . 

513 % 

编写 习题 5.11 "PS BS — IPRC IO RPH, EAKA ЛЕН ЖАНТ. 
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我 们 对 这 个 运程 的 测试 得 到 将 浮 点 数 的 CPE 为 2.25,。 描 述 将 性 能 限制 在 最 好 CPE A 2.0 f PI 


АЖ. 

5.14 %% 

РРА А — TREDDA, ЛТА ЈЕ НЯ КЕЗІНДЕ, ТЕЕ НЧЕ, ОП 
ЕПВ F EO I 

1 int Facriint n) 

2 { 

3 int 1; 

4 irt result = l; 

5 

Б for (1 = n; 1 > 0; i--) 

7 result - result * i: 

D return result; 

3 `) 


通过 这 样 做 ,他们 将 隧 数 的 CPE 数 从 63 降低 到 4， 这 是 在 Іше! Pentium III ЕЙІН CECI D. 


不 过 ， 季 们 还 想 下 得 再 好 一 点 。 
其 中 一 个 程序 员 断 说 过 循环 展开 ， 她 写 出 了 如 下 代码 ; 


1 int fact ua (int л) 

2 1 

3 int i; 

4 int result = 1; 

5 tor {1 = n; 1» 0; 1--2) ， 

b result = (result * i) * {i-l}; 
7 ) | 

8 return result; 

9 ) 


T3EB AE. ДВ 4VELXISESY n 的 某 些 值 返回 0， 
А. ATRE n, faci u2 和 fact Z3& [P| AS |н] ? 


B. 给 出 如 何 收 正 fact и2„ ЕЕ, MOTI PLE S ЖАНЕ, АЖ Йй — МЕНЯ. 


C. 于 fact u2 司 用 基准 程序 ， 显 示 性 能 没有 改进 。 你 会 如 何 解释 这 个 现象 呢 ? 
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D. ЖАНЕ ТАН Л 


Б result = result * íi * (1 - 1)); 
i 让 怎 个 人 惊奇 的 是 ， 现 在 测 出 的 性 能 有 СРЕ 2.5， 你 怎样 解释 这 个 性 能 改进 呢 ? 
515 % 


РЛЫ T. ЗЕР АЖЕП 944185. 


1 /* Return maximum of x and v */ 


2 int max [int x, -nt yj 

3 

d return [x < y) ? y : XI 
5 } 

516 v9 


ТЕЛІ ИЗО, ШЕЛІ FJE [Уи я) 

val = cond-expr? then-expr : eise-expr. 
m H] ЖЕ”: Y PESE URS 

val = then-expr; 

temp - else-expr; 

test - cond-expr; 

if (test) val - temp; 


х Е ЕЛ 个 条 件 传 送 指 令 来 实现 的 ， 以 练习 题 57 Bj. АЛА TRUE ЕЕН 


517 %% 
МЭНІНЕ — pk k ri ЕЖ: 


l п ist sumilist pir 15) 

2 { 

3 int &um = 0: 

4 

5 tor i; ls; ls - ls-snext) 
б sum += ls-»dàata; 

7 return вш; 

B } 


ШЖ ЕЛ МЕИ ЧАБ EROR EU F: 


addl 4{%еДдх},%едх movi $i€edx.ü) 


145: 


addl %.1,жеах. ( 
rovl i*edx],sedx load i$edx.0) 


tasti £&adwx, ted test] *enx.i,*edx,.]1 





пе bgi jüne-taken cc. 
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А. ЖЕК 5.31 А. Ж PR UE BH ЕЭ. АКАУ ТЕКЛА. [8038 — IP BRL AMRANT. 
B. 我 们 对 这 个 函数 的 测试 得 到 CPE 29 4.00. ЖЫЙ A 7r pisi В s 8 7 

5,18 %% 

上 面 的 前 数 是 问题 5.17 中 所 示 的 链表 求 和 滑 数 的 -… 个 变种 ， 


1 int list sumZílist ptr 18) 
2 l 

3 int sum = 0; 

4 list ptr old; 

9 

Б while (15) 1 

7 old = ls; 

B ls = ls-»next; 

9 Sum += old-»data; 
19 } 

11 return sum; 

12  ] 


BH HX. GER Р eR CERE fra as n] ЛА ҚАТ PLURES MR 
器 访问 
循环 的 汇编 代码 和 第 一 次 选 代 到 操作 的 翻译 如 下 : 


novl %ейх,%есх 


novl {Федх), тейх load í(*edx.0) 


addl ií(f&ecx],£€eax movi 4(X*edx.ü] 


аай1 t.1,*eax.() 
testl &edx, edx testl *edx.l,X*edx.1l 
jne LAB ;ne-taken cc.1 





MW. ATARE movl Федх, becx 不 需要 用 任何 操作 来 实现 。 它 的 处 理 只 要 简单 地 将 
标记 edx.0 5 Фесх 联系 起 来 ， 这 样 一 末 ， 后 面 的 指令 addl 4(%есх), %еах 就 会 被 翻译 成 
以 edx.0 FAEM Se EX. 

А. 按照 图 5.31 的 风格 ， 男 图 说 明 循环 站 三 次 乏 代 的 操作 的 调度 。 回想 一 上 只 有 -人 加载 单 元 。 

В. 我 们 对 这 个 滑 数 的 测试 得 到 CPE 为 3.00。 这 与 你 在 A 部 分 中 面 出 的 图 一 致 呀 ? 

С. 这 个 阴 数 比 回 题 5.17 中 的 函数 怎样 更 好 地 利用 了 加 载 单元 ? 

5.18 % 


候 设 给 了 你 一 个 任务 ， 要 提 商 一 个 出 3 个 部 分 组 成 的 程序 的 性 能 。 部 分 A 需要 整个 运行 时 间 的 
20%, Wir B % * 30%, ПЕЛСЖЕЕ 50%. MAE 1000 美元 能 将 部 分 B 的 速度 提高 到 3.0 倍 ， 
也 可 以 将 部 分 C 的 速度 提高 到 1.5 倍 。 哪 种 选择 会 使 性 能 最 大 化 ? 
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练习 题 答案 


练习 题 5.1 ЖЖ 
这 个 问题 说 明了 存 铺 器 别名 的 某 些 细微 的 影响 。 

正如 下 面 加 了 注释 的 代 妈 所 示 ， 络 果 会 是 将 xp 处 的 值 设 置 为 0: 
= *xp + *хр; /* 2x */ 

Z *ухр = *xp - *xp; /* 2x-2X 

j *ухр = 


= Ü */ 
"XD - *хр; /* 9-0 = Ü */ 

XX ДП ВА ЕРАТА E ИЛИНЕ Жн ЕН. RU B ТА 5 хр ЖП yp Л А 
Ел, ADAE ГД ИЙНЕНИ НЕ. HivnB US EP FE P ЖАН l| pt U. 

^ 3E 5.2 EE 

这 个 问题 说 明了 CPE 和 绝对 性 能 之 间 的 关系 。 可 以 用 初等 代数 解决 这 个 问题 。 我 们 发 现 对 于 
<2, WA IRH. ХҒ3<п<2, 版 本 2 最 快 ， 而 对 于 n>8， 版 本 3 最 快 ， 


5] 5.3 答案 
XXE aj RERO]. ЕСЕТА А 1—7 for ОИ) ОНА. ПА. АК) BUT 
的 次 数 是 不 同 的 很 重要 。 


| KH | mn | ma | inr | square 
А | i) 





Ж ЫЫ 5.4 Xx 


正如 我 们 在 第 3 章 中 发 现 的 ， 从 汇编 代码 到 CC 代码 前 逆向 工程 提供 了 对 编 详 过 程 的 有 用 见识 。 
下 面 鸭 代码 给 出 了 对 十 通用 数据 和 通用 合并 操作 的 形式 ; 


1 void combinebpxBivec ptr v, data t %девЕ) 
2 1 

3 int length = vec length(v!; 

à int limit = Iength - 3; 

5 data t «даға = get vec startív); 

5 data tL x = IDENT; 

了 

8 


int i; 
Ü ж Combine š elements at a time */ 
10 for {1 = 2; 1 < limit; i+=B) Í 
11 x = X OPER data[90] 
12 OPER data[1] 
13 OPER data[z] 
14 QPER data[3] 
15 OPER datal4] 


16 ОРЕК data[5] 
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17 ОРЕК data[$] 

18 OPER data[?7]; 

18 data -- В; 

20 } 

21 

22 /* Finish any remaining elements */ 
23 tor [; 1 < length; i++) { 
24 X = X OPER data[U]; 
25 datà-4*; 

26 ) 

27 *dest = х; 

28 } 


我 们 手写 的 指针 代码 通过 计算 指针 的 结束 值 ， 能 够 消除 循环 变 景 i。 这 又 是 - -个 训练 有 素 的 人 
常常 能 够 看 出 示 些 被 编译 器 忽略 了 的 变换 的 示例 ， 


练习 题 5.5 管 案 

HERI (spiled) 值 通常 存储 在 本 地 栈 帧 中 。 因 此 ， 它 们 相对 于 %ebp 的 偏 移 为 负 。 我 们 可 以 在 
ЕН 12 行 上 看 到 这 样 一 个 引用 。 

A. 58 limit 被 盗 出 到 栈 中 ， 

B. 它 在 相对 于 名 ehp 偏 移 为 -8 RF. 

С. 只 有 在 确定 是 否 会 选择 结束 循环 的 jl 指令 时 才 会 需要 这 个 值 。 如 果 分 支 预测 逻辑 预测 会 选择 
Лх, 那么 上 一 次 迭代 就 能 在 循环 测试 完成 之 前 进行 。 因此， 比较 指令 不 是 确定 循环 性 能 的 关键 路 径 
的 一 部 分 。 此 外 , 习 为 这 个 变量 不 会 在 循环 中 被 改变 , 所 以 把 它 放 到 栈 中 不 需要 任何 额外 的 存储 操作 。 


练习 题 5.6 答案 

这 个 问题 证 明了 程序 中 很 小 的 改动 是 如 何 能 够 造成 巨大 的 性 能 差异 的 ， 特 别 是 在 乱 序 执行 的 机 
w L. 图 5.38 表示 了 函数 针对 每 种 结合 的 一 次 授 代 的 乘法 操作 的 调度 。 ЖЕН МЫ, 而 
每 修 乘 法 接收 z HHE CERA rO 并 计算 一 个 新 的 值 (显示 为 1)。 不 过 ， 如 灰色 虚线 所 示 ， 关 
键 路 径 (critical path)， 也 就 是 灶 + 的 连续 更 新 之 间 的 最 小 时 间 可 以 是 12 (А1). 8 (A2 和 A5) 或 4 
CA3 和 А4) 假设 处 理 器 达到 最 大 的 并 行 度 ， 那 么 只 有 这 个 关键 路 径 会 限制 CPE 的 理论 值 ， 

这 会 得 到 下 面 的 去 : 





从 这 张 表 我 们 看 出 结合 A1、A2 和 AS 达到 了 它们 的 理论 最 优 值 ， 而 A2 АЗ fg DORACE TEE 
5 小 周期 ， 而 不 是 理论 上 的 最 优 值 4 





图 538 问题 5.6 中 情况 的 乘法 操作 有 的 调度 
灰色 虚线 表示 限制 变量 + 的 连续 更 新 必 间 时间 的 关键 路 答 。 


练习 题 5.7 答案 

这 个 问题 证 明了 当 使 用 条 件 传送 时 需要 小 心 。 它 们 要 求 对 源 操 作 数 求 值 ， 甚 至 于 在 不 使 用 这 个 
值 时 ， 

这 段 代码 总 是 间接 引用 хр 《汇编 代码 的 第 2 行 )。 fE xp 为 0 的 情况 中 ， x mS ETT s 
H. 


练习 题 5.8 答案 

这 个 问题 要 求 你 分 术 个 程序 中 潜在 的 load-store 55 5 ERI. 

А. 它 会 将 每 个 元 素 ag AR, 0<1<998. 

B. 它 会 将 每 个 元 素 af 设置 为 0， 0<1<999. 

C. 在 第 二 种 情况 中 ,一 次 达 代 的 加 载 取 诀 于 前 次 夺 和 代 存储 的 结果 。 因此， 在 连续 的 达 代 乙 则 有 
SAHAR, 

D. ESA СРЕ 5.00， 因 为 存储 和 后续 的 加 载 之 间 没 有 由 夫 。 


练习 题 5.9 ЖЖ 

这 个 问题 说 明了 Amdahl 定律 不 仅仅 只 适用 于 寺 算 机 系统 ， 

A. 按照 等 式 51， 我 们 有 в-О5ЖІЕ-15. S PRU E, FIL Montana 1746 1500 5; 8185 4E 10 
个 小 时 ， 而 剩 下 的 行程 也 需要 ]0 个 小 时 。 这 会 得 到 增 速 25K10+10)=1.25。 

B. ЕН V 5.1， 我 们 有 a= 0.6， 和 而 我 们 需 邓 9-553， 根 据 这些 我 们 可 以 解 出 上 ， 更 直观 地 说 ， 
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为 了 使 行程 加 速 53, 我 们 必须 将 整个 时 间 降 低 到 15 个 小 时 .Montana 之 外 的 部 分 仍然 需要 10 个 小 
时 ， 所 以 我 们 必须 在 5 个 小 时 内 通过 Montana。 这 要 求 行 驶 速度 为 每 小 时 300 公里 ， 对 于 卡车 来 说 
实 什 是 太 快 了! 


练习 题 5.10 EE 
通过 一 些 示例 是 理解 Amdahl 定律 的 最 好 方法 。 这 个 例子 要 求 你 从 - ' 个 不 同 寻常 的 角度 来 看 等 
Å S. 
这 个 问题 是 这 个 等 式 的 一 个 简单 应 用 。 给 定 $=2 Ж a208, ІШ AR k: 
l 
{1-0.8})+0.8/Е 


04-18-10 
К = 267 


2 = 


li 
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局 部 性 

存 情 器 层次 结构 

m ES ТЕЕ ТЕ ЕЯ 

i Em s TH 

TE: 高 速 钥 和 存 对 程序 性 能 的 影响 
He: 利用 程序 中 的 局 部 性 

МЕ 
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НАА, 在 我 们 对 系统 的 研究 中 , 我 们 依赖 十 个 简单 的 计算 机 系统 模型 ,， CPU 执行 指令 
而 企 储 器 (memory) 系统 为 CPU 存放 指令 和 数据 。 在 我 们 简单 的 三 型 中 ， 存 储 占 系统 是 个 线性 
的 字 АН, тп CPU 能 够 在 “个 节 数 时 间 内 访问 每 个 仓储 恬 位 置 。 虽 然 迎 今 为 止 这 都 是 “个 有 效 的 
BU, HEERA МРНҚ АЗЕ 工作 的 方式 。 

ЖЮ b. AHAA (memory system) 是 一 个 具有 不 同 赛 董 、 成 本 和 访问 时 间 的 仓储 【storage) 
设备 的 层次 结构 .CPU ЕЕЕ ЕН МЕ ТЫН CPU IJ BS TORTE i$ Ж-А $ Ссасһе 
memory) EA Tihi (stored) dS REI Tir (main memory， 简 称 土 李 中 数据 和 指令 站 集 
的 缓冲 区 域 ， 主 存 暂时 存放 存储 在 较 太 的 慢 速 磁盘 上 的 数据 ， 而 这 些 磁 盘 常 芝 又 作为 企 储 在 通过 网 
绪 连 接 的 其 他 机 器 的 磁 杏 或 磅 带 上 的 数 招 的 组 证 区 域 . 

存 赃 器 层次 结构 基 可 行 的 ， 这 是 因为 与 上 个 更 低层 次 的 存储 设备 相 比 来 说 ， 一 个 纲 切 民 好 的 
程序 个 问 于 更 频繁 地 访问 其 一 个 层次 上 的 存储 设备 。 所 以 ， 下 一 后 的 存储 设备 品 以 更 慢 速 一 必 ， 也 
因此 更 大 ， 每 个 位 更 便宜 。 整 体 效果 是 “个 大 的 存储 恬 池 ， 共 成 本 与 层次 结构 底层 最 便 官 的 存储 设 
备 相 当 ， 但 着 却 以 接近 于 层次 结构 硕 部 仓储 俊 备 的 局 速率 由 程序 提供 数据 。 

伍 为 一 个 程序 员 ， 你 需要 型 和 解 仓 储 器 层 党 结构， 因为 它 对 你 应 用 程序 的 性 能 有 者 已 太 的 影 吊 。 
如 果 你 的 程序 需要 的 数 括 是 存储 在 CPU 寄存 器 中 的 , 那么 在 执行 期 间 ， 在 零 个 周期 内 就 能 沪 冲 到 它 
们 。 妇 昌 存 储 在 高 速 缓 在 中 ， 需 要 1 一 10 个 周期 。 如 果 存 储 在 主 存 中 ， 青 要 50-100 个 周期 。 而 如 
ЯТА ТЕА С, go EAZ 20 000 000 个 周期 ! 

XA H ЖАЛ LAL ЖЯ —1Т ЖАТ АНЛА: ИЖЕ Т RIZR Min НК Q: e бй dE EE UK 
ФУНК КЖ АЛ, ЖА АИЫН КАЈА АРЕНЕ, ТЕЛІ А IN re E RIA EPIS 
ИЧИ Л, AAEE CPU BE E Bus ЇН] ЭРТ ЇЇ]. 

这 个 思想 围绕 着 计算 机 程序 的 个 称 为 局 部 性 Gocaliy) ЕЖЕ. Д1 B ЫЫ ИЕНА 
眉 回 于 一 次 又 雇 地 访问 相同 的 数据 项 集合 ， 或 是 怖 向 于 访问 邻近 匆 数 据 医 集合 。 上 其 有 恨 好 局 部 性 
的 程序 龙 局 部 性 闭 的 程序 更 多 地 倾向 于 从 存储 器 层次 结构 中 较 高 层次 处 访问 数据 项 ， 因 此 运行 得 更 
快 。 例 旭 ， 不 同 的 条 阵 乘法 核心 程序 扫 行 相同 数量 的 算术 操作 ， 人 性 是 有 不 辐 程度 的 局 部 性 ， 它 们 的 
1e 1; P] [8] n] БУЯН Ж 6 f! 

在 本 章 中 ， 我们 会 看 看 基本 的 存储 技术 一 一 SRAM 存储 器 、DRAM 存储 路、ROM fr ЛП 
各 一 一 并 盾 述 它们 是 如 何 被 组 织 成 层次 结构 的 。 特 别 地 ， 我 们 将 注意 有力 集 中 在 CPU 和 主 存 之 间作 
2M ERE D НУН ЕТЕТ В 38 Е. BS CIAR E REP A 我 们 问 和 你 展示 如 何 分 析 
信 的 已 程 训 的 局 部 性 ， 而 且 我 们 还 介绍 收 进 你 的 程序 中 局 部 性 的 技术 。 你 还 会 学 到 一 种 描绘 某 台 
机 器 “存储 占 层 议 结 构 的 性 能 的 有 趣 方 法 ， 称 为 “存储 器 山 《memory mountain}”， 它 给 出 的 读 访 
加 次 数 是 局 部 性 的 “个 量 数 。 
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VEREBLRORIEL CUL BACEUS КЕНЕТ ЖЕ ДА. АШК ЕЛЖАН S IL TUE ҮТ 
ЫН. 最早 的 IBM PC 甚至 于 没有 硬盘 。1982 S| N WJIBM PC-XT 有 10M + ИП. А 
2000 ^F, 主流 机 器 已 有 1000 454 PC-XT МИЫ, ПАКАНА DL PST tE 10 倍 的 
速度 增长 。 
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611 随机 访问 存 情 莫 

Binip HAE (random-access memory, RAM) 才 为 了 类 一 一 租 查 的 和 动态 的 ， 表 志 RAM 
(БАМ? 比 动态 RAM (DRAM) Ж. it EJE. SRAM 用 来 作为 高 速 埠 存 存储器 ， 攻 可 以 在 
CPU 427 Е, ELUR CPU 芯片 上 。DRAM ШП ЖЕ {ШШЕ ЕЕ PIER Au. 
“ИШЕ SRAM ЖЕШ ЛӘДЕ ЕЗ. OE DRAM HH LEE ЛЕЕ. 

静 者 RAM 

SRAM 将 拇 个 性 存储 在 一 个 到 稳 吉 的 (bistable) {РИЙ л. (сеп) g. VT ECL FX 
A E IER. ЕГЕ S INE. 它 可 以 无 限期 地 保持 在 两 中 不 同 的 电压 配置 
(configuration) AS (state) 2 —. MO FEROCES NE RET Ri ИНЕ. dB ZR SEHR 
WEBER TB un eds HA. IER — EE тш 61 Фан n s Fen ERR 

ЗААР НИДА А Д Е ГАР, 它 是 稳定 的 。 从 其 他 任何 位 置 , 钟 探 邦 会 例 向 一 这 或 另 一 边 。 
ӨМІ, ph3R o RETE E FEM EIS DA LEER, Tix T GRE E SM (metastasle) 一 最 
ЗНН ЕРЕН Е. IH BEL тал ТӘН наны. 

由 于 SRAM ИИ ЖЛ АКНЕ, ПЕН, GW: kahani. Jp Е. DU 
TT, KRALE “ИИ. da e m f. 





81 ttf 
同 SRAM й, {ӨЕ НҮП ЕТИН eds 


动态 RAM 

DRAM Ж ТРИ А B SEE EB. Th Gia, AS RNXETHUTLOd ZEB 
EHE. 30x10" 法拉。 不 过 ， 回 想 一 站 法拉 是 一 个 非常 大 的 计量 单位 。DRAM 存储 器 可 以 制造 担 
丰 常 密集 一 每 个 单元 由 一 个 电容 和 一 个 访问 蝇 体 管 组 成 。 但是， 与 SRAM 不 同 ，DRAM МІ 
元 对 干 挑 厘 党 敏感 。 当 电 客 的 电压 被 挑 河 之后， СИКШИ Т. ЕЛАН ЕО а 
hu. We E. АНАН m КИЛ. DRAM 单元 的 阵列 。 

TEN ЧЕЛ ЖЕН ИКЕ DRAM 单元 在 10—-100 SEHR dm. dug uma 
ІШПЕ ТЕН ЫН ce ME, ix^ REI ав T fr hh Ж S, bk АПИ BE hii p ie LL 
ЖН Fr fi db rf y. pee tb MER LIE А, ИРИДЕ WELT CN 
4l. 32{# КЕГЕН 38 y KARI), Е, її єн ЕТЕТІНІН. 

ІҢ 6.2154 T SRAM 和 DRAM {Г ЕШШ. Пан, SRAM ШЕРІ, 与 DRAM ЖЫ), 
ETHES. SRAM 的 存 取 比 DRAM tt, SRAM Милан АРИНЕ ЖЩ. feu 
SRAM 单元 比 DRAM "Poo FREE ДЖЕ. СТА Е. ПНЕ, Ех. 





ШІ 8.2 DRAM WI SRAM ЙІНЕ 


常规 的 DRAM 

DRAM Ü Hh mT (I) РВЕ А THER, GupercelD, & TC IE vw DRAM ñ 
元 坦 必 的 ,一 个 d'Xw 的 DRAM ЖМ T dw OREL. BIB GLAEILIBIE е e 列 的 长 方形 阵 
Pj, AT re=d。 每 个 超 单元 有 囊 如 {i, 几 的 地 址 ， 这 里 ide. МІ 表示 列 ， 

Иш. 图 6.3 展示 的 是 一 个 16Х8 的 DRAM 芯片 的 组 织 , 有 dalo ШЙ. E Е май 
8, rea IT. c=4 Hj. РИ D OR T Bb Db TUE. зығы (pin? ЖШ 
А ДЕ. ARRAT thA. З НТА ЕШ, B dan ЖШ. E 
ИЕ — 7 Baju Hr kp Fr PH E 3 ШЖ 2 adde ШИ. 它们 挤 带 位 的 行 和 列 超 音 
HM. Nh meds ДЕШЕ НН Ж. 





аз 128 (0 lixa if] DRAM ЖЕ ҖЕП 
$i. xXTXEMIM X 
filu, k k Ж DRAM +4 }аж—41 жн. TAX ag Me THERE d rex 
(cell ， 使 这 个 来 语 具有 DRAM ARE Ф. алайна» "F (wod F. ЖЕ АЖ LA 
-AFE Атаба. ПЯТАЯ Е “AA (неке, 


WF DRAM ЖЕЕ ЖЕЛ A ЖЕЕ BIB. З ар EE w іу 

RAM Ú 2 — i M аР DRAM dH fer із. ТЕНІЗ. TERI EE RUNE MEET ИН 

i RIEM DRAM. ЕРИН j DRAM feriens fr ie kp row. rH E iE 

HO RAS Um. Access Strobe, TT Ur ji] A PO o, ОДЕ ДЕ W E; CAS (Column Access Strobe, 
名 访问 造 通 脉冲 ) ЖЖ. PEE RAS 和 CAS 请 求 共享 同样 的 DRAM НЕН. 

Bum, ЖАШЫЛ 16X8 的 DRAM ЕНЕ mO AiR WE a, dm ea 

(a) Мс. DRAM 的 响应 是 特 行 2 tenth qe EMEULRI— PA RETE IE. ЖЕЖ. жарты 








器 发 送 列 地 址 I. SUBE 64 (b) т. DRAM 的 响应 是 从 行 线 溃 区 捷 贝 出 超 单元 人 2.1) 中 的 位， 并 
ied A TEE RSS. 








— =т= LLL МЕЙ E 
(a) AE 2 CRAS ИЖ) (b) BIN 1 (CAS AR — 


54 读 一 个 ОРАМ 超 单元 的 内 容 


电路 设计 者 将 DRAM 组 织 成 二 维 阵 列 而 不是 线性 数 租 的 一 个 原因 是 降低 蕊 片上 地 址 管 脚 的 数 
NL. И, ЖЖП) 128 位 DRAM 被 组 织 成 一 个 16 ЕЛЕНЕ, МІР 0—15. 
а Аа ШЕР ЕТЕРГЕ Т 
V pr ІШІ, 

fi S HR 

DRAM 必 片 包装 在 存储 器 模 岂 (memory module) th, 3531 E RN LE. ^ x med ta 
JF: 168 шылы HE EHE (Dual Inline Memory Module, DIMM), Bl 64 {ч ЭЖЕШ 
RETMPUM RA ТЕЕ АТЫ ЖЫ НЕЕ. ЖЫ 72S MIA a НАШЕ» (Single Inline 
Memory Мойше, SIMM). EU З З ЕНН. 

Б &5 展示 p | ҮННЕН. ire ҢИЛ мы 的 ЕМ X 8 的 DRAM 4H, 
қышы МВ АТТ), WAEREA 0—1, 每 个 超 单元 存储 主 存 的 一 个 字 节 ， 而 用 丰 虚 
本 单元 地 址 为 ij) 的 信 个 超 单元 来 表示 主 存 中 字 节 地 址 A 处 的 64 位 又 字 '。 在 图 65 中 的 示例 中 ， 
DRAM 0 存储 第 一 个 OERO FW. DRAMI EMF- EN, WEEN. 

СНТ ЊЕ A 处 的 一 个 而 ЯШЕ, FARER А 1:3 + HU НН; 它 
=... hacc Йй, na "mI ron AEG), НЕ 
i aic fi FERE SEHE go ІНГЕН DRAM, ЛЫН, RE DRAM 输出 它 

ti) 超 单元 的 8 位 内 容 。 横 块 中 的 电 串 收集 这 些 输 出 ， 并 把 它们 各 并 成 一 示 ы P 再 返回 从 
A — ал trag. SuEB 

ШШЕ ТИНИН EHE BUMP. ЖЕКА ЕЙ. EARNE. SERRA 

ШАМ, ЫНАН A IHR A, ЖА КЕНЕЛЕ. Ж yE PRIME HE k. 








| IAM AE 64 3 “Nip. 
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1$ 5]28 6.1 

EFA, r 表示 一 个 DRAM PUB effi. r AFHR р, KARA faba B. b 表示 出 
TAER. f TT d F DRAM. ЖЖ 2 6X dp det HAC TË PË max(P,. b d. max(b,, B.) 
ЖЖ ira pa Gad 6 43 Р k aii. 





ral w 1 
i DO: MN oe di 
ШЕ атама) 
Ї шын 
i BU RM BB 
| g Ё | DRAM FAIT] ЫМН 
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ШЕ 65 ЕРИНЕ 


增强 的 DRAM 
HIER DRAM 存储 器 ,而 生产 厂商 试图 跟 上 迅速 增长 的 处 理 器 速度 , 市 场 上 会 定 册 的 出 新 的 
MA. ще ШЕЕ ТЕН DRAM 单元 ， 评 进行 了 一 些 优化 ， 枚 进 了 访问 基本 DRAM 单元 的 速度 ， 
s" FPM DRAM (fast page mode DRAM. RAIRA DRAM?) ЕЛ) DRAM 将 起 单 元 的 一 整 行 
HEU B mata КП. HT. IZ A ЇЧ. FPM DRAM Xii] iriti 
Ui ig aT ELCHE M ETRAS RERUR SE. imaku T ix ш. ніш, А-А DRAM 的 行 
{ПЕШТЩ Ал. TARR ЕЩЦ КА СА Wk. ЕКГ НЕНЬ i 在 每 中 情况 中 
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于 是 一 样 的 ,型 从 一 个 FPM DRAM £i] —IT hiik HI scs ЖЕНЕ ШИ ЕЛЕ —-1- RASCAS 
Wk. MARSI CAS Ж. ЖІП RASCAS ИЖЕ ЕШ IX. ЖЕШ T 
起 单元 , $e Fx Hioc fA TUR іт, DIJEIETHE YE ЛШ. 
* EDO DRAM (extended data out DRAM. ЖИШШ DRAM). FPM DRAM 的 一 个 增强 
FEX. EARRA CAS (81H D] EXCPEUCIERE— A. 
• SDRAM synchronous DRAM., Р} DRAM). КЕШПЕ e GR IS HH — n ata e 
{н Жї. WU]. FPM 和 EDO DRAM 都 是 异步 的 ，SDRAM ШЫЖЕ ag 
MMPH Bof КЕНЕТТЕН ИЕЫ S. RADICA HIE, BS W 
qat SNAM ЕРЕЖЕНІ ТИНЕ ИНЕШ ЕЁ ЛЕН. 
ҚАМ (double data-rate synchronous DRAM, ЕЕЕ DRAM); DDR 
SDRAM T SDRAM НІН. КОЖЕ НӘ А ЛЕНІ, Am dh 
DRAM i38 rir diis. 
“ Rambus DRAM RDRAMI。， 这 是 另 一 种 私有 技术 ， 它 的 最 大 带宽 比 DDR SDRAM 的 更 高 。 
“ VRAM RAM (Video КАМ, WA). ЕНЕҢЕЕНІІШЕНІ [X P. VRAM [9] BM EPM 
DRAM ЖЫ. 两 个 主要 区 别 是 ， ПУНАМ WH ЖЕ ККА a ІК ҖЕ N ЖН 
ШЧҮЧЙЕВПЧ; GOVRAM ЖИА ГЫННАН Н. DOE. ЕНЕВ Е НЕ 
(й CS) МЕН. ШЕЛ НЕ ЖИНИ GE. 
$i. ОНАМБВЖИЕНТЕН S 
直到 1995 Ж, K $t PC 都 是 周 FPM DRAM ИІ, 1996-1999 4-, EDO DRAM 在 市 场 上 占据 了 
9, d FPM DRAM LPM EGET. SDRAM 最 早出 现在 1005 A E d P. QON ооо Ж. k Ë 
# PC 453 8 SDRAJ 


Ем 

ШАЮ, DRAM 和 SRAM zz Z EIER. АРЕ ЕА, ТЇП E KS (уйше). 
5— WB. ФА АЫ (nonvolatile memory) 即使 是 在 关 电 后 ， 仍 灼 保 存 着 它们 的 信息 。 有 和 根 
ЖӘНЕН КЕНІН. HTELA SA ROM HERA PRET Githa ЦУ, Bid Е 
ERRA ROM (read-only memory, АЖ Ж). ROM 是 以 它们 能 能 被 重 编程 (E) ШКЕ R z] 
ET ETT ШЕ ЕҤ ЕНЕ ЖК +]. 

BET ERES E Н ЕН ЖН — x. 

EPROM (erasable programmable ROM, TEY TAH ROM) ӘТЕШ, ЖЕ. 
АЗЕРИ r. ЖКН ЖЕШИП. EPROM 单元 就 被 清除 为 0。 对 EPROM 编程 是 通过 使 用 一 种 
把 1 写 入 EPROM 的 特殊 设备 来 完成 的 ,EPROM ЕШ RNC RR ЖЩ E Br MESE T EL i RI 1000 
К. EEPROM (electrically erasable PROM. % 576 РЕКОМ 类 似 于 EPROM, BERT R - 
个 物理 上 独立 的 编程 设备 , KETO А Ж ЕНЕ ІНЕ. EEPROM КЕ ЕКШ: A ЖИЙ 
Ж ПЗЕ 101%. A (Паһ memory) Ж—Ж {ЕВ ЕКЕШ. Ж EEPROM， 它 可 以 插 
Ааа. ТЕБІНЕ. ИЛАН ТЖ. 

ГЕНЕ ROM ТЖ ТЕ ak pe l R] $. firmware). ЧРИ AnGR, Теш 








JU4 Hot 


行 存储 在 ROM PHEA. ERREP T bR RR S C P. PC 的 
BIOS (EXPERS) mE. ERHET. ШЕЕ ЕНШЕ. WARR ERTE А 
CPU 的 ID“ 输入 /输出 ) ek. 


iibi F íf 

Fo RGB SER SON (bus) 的 共享 电路 在 处 理 器 和 DRAM {РУН E 08]. ЯҒ CPU 和 
EF WAARA MEAL- S mp: HUE. IX iti MO Н Е E Cbus transaction). Ж 
ҚҰЖ (read transaction) АЕ S WS] CPU. E53 (wrote transaction) A CPU fei W Ж 
Ed. 

А-ны, шетін, REMEHA. ik p АШИ. HERBES] 
Щу [и] Н 9, Шар [И]. BD. HETO Ей ЕН РЯ. ЖЫ 
Бї БЕ. Hid SEES ДАТ ЕН. Иш, ЧИЛИ ЕЕЕ 
的 吗 ? ЖЕНИ ШЕШЕН АР ЕНЕ ШО EA? 这 个 事务 是 读 还 是 写 ? ЕЗ ЕКЙ ЖАШ E 
EREA? 

еб 展示 了 一 台 和 典型 的 桌面 系统 的 着 构 ， 主 要 胡 件 是 CPU SE. AMARA VO НЕЙ CIO 
bridge) 的 起 片 组 【其 中 包括 存 情 控制 中 3， 以 及 组 成 主 存 的 DRAM FRSA. АРЕН 
AHERE. КТ p HEEL, 【sysiem bus), EH CPU EHE RI ШО 桥接 器 ， 另 一 条 总 
ЕШ (memory bus), O VO BUE REESE E fF. 

VO Pri BERE HE ЕРИН [а SEE HR Е IHR FIBI 8. ІШ АИ. DO HIE E 
ER 5.96 P eU FERE VO Аң, ФЕН ШЕКА DO 设备 共享 vo es. mu 
Wir, ЕЯНЕЕВЛИФЯННШЕН Е. 






"WB pH 


58 典型 的 连接 CPU + ЇЧ 
mE CPU Ит — ЕВЕ 2, 


mov] А, %сах 

这 里 ， 地 址 A ТИ ЖШПЕН сах th. CPU Н EB EHE (businterface) 的 电 
Pk Аа st КӨШ Ж. РЕН РНЕ У. ИЖ. CPU 特地 址 A МАНЫҢ |. ШО 
КЕЕН SERERE DER. НӨЛ GO. EFE TIPS FD ASK ЕЛІМЕН, M 
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THRG EAH. M DRAM RH ЕУ. ЕКЕ SBS. UO WIEWS АНН НИЯ 
сИЕННЯНАЫНЫД8, EP Sk B. ШІН 67 (b), ЖЕ, CPU ЯЖНЯНЫН ЕТШ 
B. АЖ КИШ. ЕНЕ ПНА A ea. ШІН 67 (с). 





(a) CPU ИЕ АНЫН 
«хк __ 


— АШ 









gama “ 
- 1 221 
(h) RAREUERA. WEF ЖЕН ШИНЕ Г 





[eh CPU АНН, НЕН ИНЕТ Ж Ten 中 


Жб)! ИНЕ mova ®всх ШЕЕ 
相反 地 ， 当 CPU At РИЧЕ 
movi %вах, А 
ІЗІН, ШІІЕеяек 的 内 容 被 写 到 地 幅 А, СРО ERES A. ЫҢ, И УКБ. B. 
CPU 将 志 址 上 直到 系统 总 线 上 。 存 储 器 从 主 存 总 贱 读 出 地 址 ， 六 等 特 数 据 到 达 ， 各 图 68 (а). ЕР 
Ж. CPU Hte PS IRE e LS RE. ШЕ вв (b), ЮЕ. ИЛИШ НЕЁ. 
Hn ni mix eor fé ОВАМ th, BEAR (с>. 





(a CPU Ж ШЦ А КОМЫ ЫН. ЕТЕНЕ ТАНЕ. HW W KP 


ñ ira 






(b) CPU ЖКК v W ü) Е 


LEE кА 


Li +TM В ЕЕ ШТ у, ПЕК ТАНА А 
E58 ЫШ тоуібес А ОЕ ШЕШУ. 


512 磁盘 存储 

磁盘 是 广 为 频 用 的 保存 大 量 数据 的 存储 设备 ,存储 数据 的 数量 级 可 以 达到 几 十 到 几 百 千 兹 字 节 ， 
向 基于 RAM КЕШЕ RE E Л.Н ЁЛЕ f$. Жі, MEA Fui m Lara, EA DRAM 
ШЕТ ІШЛІЕ. ША SRAM i£ T 100 54. 

iB a Hi 

BEEN (ater) ШІН, ҒАН ИШ, ЖШ (surface) ATEHERE. BUE 
ПЕН — ИД ҤЕ E 4b (spindle), ЕРЕ НАЕ Е НЕ 1 Е 【rotatioaal ге) ЕН, ЖЖ 
lE 5400-15 000RPM (revolution per minute, ІР), ВЕНА РАТЕ Р, 
ПЕ НЕНЫ. 

Н 69 (a) Nos T —T A SHOE ЕНІНІҢ. BET ed Hd — HERE EE (аск) 的 同心 贺 
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----------.... 0, оу; 
НІНІ, НІҒСЕШЫЕШ S HL (зелог), fI [C fo rH 8 ЕНЕ (ИЛ 512 字 
Tio, ie НА SEX ENEH H. NIC fi] d si ж (gap) ЖЩ. 这些 间 阶 中 不 在 
НЕНІ. (ШЕНГЕН ЖЕШ! IC d 

ЖЕН TRETA- ENAR. БИШЕ IHRE HIT RUE, Ий 9 (b 所 
T. OPERE OH REGERE RAE (disk drive), WA ERROR E (disk), 








uf 


a) 一 个 相片 的 规 图 (b) ЖТЕНШЕН 


H9 ШЕНЕ 
ШИНЕ Н ЖҮН h Ceylinder) ЖЕ EB HERE. Dy, НИНЕН Н 
8m E Ph ЖЕ ЖН ІШІН ТТИ -PRAEAN tA pi. 8 
ЕЙ HEAR s, ЖОНЕ А АЗ FHEH L eR. 


Шаш 

一 个 磁盘 上 可 以 记录 的 最 天 位 数 被 称 为 它 的 量 大 窜 量 ， 或 者 简称 为 容量 。 磁盘 容量 是 由 以 下 技 
术 国 素 决 定 的 : 

* EREI (recording density) Cie s Bt 3 9 Ba oU А Е. 

° ЖШН (track density) Gl; Айы Egal — des S 可 以 有 的 磁道 村， 

e ШЖ М Careal density) ({ Р Jr), ШЕН 5s ad if e Ий. 

G ЖШШЕ ЛЕШЕ Ж САП). ШШЕ ПЕНИЕ ЛЕШ E. ШШ 
Ш. ДЕИ ПЕРЕРВА EH, ЖҒНЕ ВСЕ НОАК, СЕН I d S o бе 
ERRAR rese. Ж T (HERE E S КЕК Ж. ИТЕРЕ ME EE RE RETE. fi E HER 
ЧЛЕН, ынан. ЖЫ, МАШКЕ. Mc [ИШ (ЖҮГҮМ ЕЕ 
位 ) ЖЧ ЖШТ. ЖЕ, ВИК КИЕН PE B E iz E (multiple zone recording) 
МЖ. ЖЕРНЖф, Wü ü Aeg DAT APEGO ТЕЙ. WIAA Lreconding zone). HAE 
i Ел П S ac Cfr Ho fc ІЛ K , W F к е ERE i i E ІШ 
ШЕНИН. ЕЙ, КЕҢЕШИ 7T 3 ПТИ РОС EAN. 

РЕ АШ Г EAA: 


Dirk Буе: average seciors 3 есік A surface;  platers 
capacity " Р” р “оше др х dak 
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Иш. ЛЕМІН ЧЕЙ. H5 THREE. BETIS 512 W. ET I] 20000 НЕН. ЕЗІН 
道 平均 300 7-80, Rk COE FEE RE: 
Dik ЗІ2імез 300 sectors «20400 ғагіл, 2 rurfaces 5 platters 





capacity желе” ^ pack 7” surface ” planer “ dik 
= 3 720000 QOO bytes 
= 3720B 


EN. ШАЦР ЗЕТ (GB) 为 单位 来 表达 磁盘 容量 的 ， 这 里 IGB = 10 7 35. 
$i. -AF PAEA? 

Tik, Ü K (kil) . M Umega) # G (giga) i EC AU LRAT ET k. sF+ 5 DRAM 和 
SRAM ЕЖЕН, if K-2U, Mz 27, &02z27, #4 S D CR Жн) шік 
XX. AT K-10. Mz I, G G= WP, Appt tatit, 

Жай, ST AUT ACE BOR) MER, Cback-of-the-envelope ) НІ, Cie Ee EX Hoa 
RAF. (dde, 2" = 1048 576 Ж 10^ = 1 000 000 #45] Ж НЫ». (279 - Muf son, Edge. n 
+ 2° = 1073741 824 ж 10^ = 1 000 000 000: (27 - 10'y TP 7. 


ЖУ 6.2 

Hiiti, c 2 Ah, 10000 i, SALEHA 400 PAR. m4 
TAE 512 字 节 ， 

i gn" 

RESET EE HERI НТ Caetnator arm) ЗЕГЕ Ж Cread/write head) 3X1 ETE B FE ЖЕП 
Mr, ШІН 610 Ca) Br. indo Hx TED. ШИГЕ uo dE RETRO E 
MUERTE LF. IRPRPIHL MGE АНЕ (seek). DWS Ы УТ Ng L. EA в 
та Ж н НА ГІНІНІҢ Сіз, Шар ix R Bh 

қы» НЖТЕН abet er tg m АВГ Terre E. ШІН 610 (h) Bros. ғ 
а-а - 数 行 动 。 在 任何 时 蓝 ， 所 有 的 访 / 写 藉 都 位 于 同一 个 柱 面 上 ， 


айй ~ 
ШЕНИН и 






i0 t RU T IS 
ku. йй Е 
л ДЫ. r km 


алаты LE 
Wu. ТЕАИ 
т XE A 
EHEH г. | 

ба) — TË h TI (bi ТУТАН 


6.10 碰 盘 的 动态 特性 
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TEES Жап НАҒЫЗ ТЕЕ K BIS КЁ O1 ЖАН БЕЙНЕ V. ЖИККЕ 
S0km/h. ПАРМАН 1, Жш ЛАКА IE F. ЯУ ERES] АУ E 
石 ， 读 / 写 头 会 停 下 来 ， 撞 到 盘面 一 一 所 谓 的 读 / 号 头 冲撞 (head стар). ЖИЙ, HESSE d HARA. 

融 盘 以 而 区 大 小 的 块 来 读 写 数据 。， 对 扇 区 的话 问 时 间 〔acecess time) 有 三 个 主 贤 的 部 分 : 寻 道 
时 间 (seek time), ЖЕМІН (rotationallatency) 和 传送 时 间 (transfer time): 

. AH HRS oT RUE НАН, EAB ЛИГЕ Ја E iri К Ий 

iñ F, Ets PSI BEA SGBEIB. ЖЇН) Tu ШИЕЛІ ИННА RATE 
n ТЕЛШ ЕО. ЛЯ ФЕР ЧЕ [8] Т, ;ww EEL SL TERA BUR D. 
的 寻 道 求 平均 值 来 测量 的 ， 通 常 为 6 一 9ms。 一 次 寻 道 的 最 大 时 间 T, ЭГЕ] EA 20ms. 
。 Ж#Н. 一 日 读 / 写 头 定位 到 了 期 望 的 磁道 ， 驱 动 器 等 竺 日 标 月 区 的 第 一 个 位 旋转 到 读 / 
写 头 直 。 这 个 步骤 的 性 能 依赖 丁当 读 / 写 头 到 达 月 标 扇 区 时 盘面 的 你 置 , 和 衬 租 的 旋转 速 庶 。 
在 最 坏 的 情况 下 ， 读 / 写 头 刚刚 错过 了 日 标 扇 区 ， 必 须 等 待 磁盘 转 - 整 圈 。 因 此 ， 最 天 旋转 
“ІҢ, BEAMER. Ж 
_1 „50 5ес5 
RPM imin 
33 Bg Pe sJ [8] Tou, шин 是 Tmax rotaria У 
e 传送 时 间 : ƏНІ T yy EEk PRI, ЖКД SEGA n] UL RARA ҢА PC ПУ) 
内 容 了 。 一 个 户 区 的 传送 时 间 依 赖 于 旋转 速度 和 每 条 磁道 的 扇 区 数 日 。 因 此， 我 们 可 以 粗 
略 地 估计 一 个 房 区 以 秘 为 单位 的 平均 传送 对 间 如 下 
Т _ loq i Ы) secs 
avg tranfer RPM (average sectors/track) I min 

我 们 可 以 估计 访问 一 个 磁盘 扇 区 上 内容 的 平均 时 间 为 平均 寻 道 对 间 、 平 均 旋 转 了 时间 和 平均 传送 时 

间 的 和 。 例 如 ， 考 虑 一 个 有 如 下 参数 的 磁盘 





Tax rotation = 





ЖН Ж 


Tag irek 9ms 
5E ROB ESTEE Ra bz Ж 400 





XP TIRES, ЖӘШЕКІН (以 ms 为 单位 ) E 


T i rotation = 1/2 XT mar rotation 


= ]/2x(60secs/7200 RPM )x1000 ms/sec 
= 4; 


平均 传送 时 间 是 
T ivg wansfer = 6077200 RPM x1/400 sectorsftrack x 3000 msísec 
= 0.02 тх 
总 之 ， 整 个 估计 的 访问 时 间 是 


400 45% 





hom 一 Га "rod * Tort roiation + Tas imagi 
= Фуру Ф 4 т 0 mr 


= 13.02 mr 


iX ГЕН Г — НЕЕ. 

* Vis — T SEP 512 ТҮРІНІҢ Ж ЖЕН ЖИ НЫШ, rie B CP SHE 
ЕШ ГЕН. BRI РЕЛЕ АЈ. 

* BOSSES р СНИ АЧ. АТОН SERE IE + 5 ERE RU FT [d s 8] 0 ñi 
合理 的 方法 ， 

е ETEM (E SRAM rper] XC 0 НЕ КЕНЕ dns, 对 DRAM 的 访问 时 间 是 bOna. 因此， 内 
Ar Ep 512 ЧЕТТ АЙ [< А, ARAA SRAM ЖІН ХЕ 256лк, 对 DRAM Ж 
大 的 是 Ans. iS UB] CAE) Oma) H. SRAM X1 40000 ff. E DRAM KJ K 
2500 信 。 如 时 我 们 出 较 访问 一 个 单字 的 时 间 ， 这 些 访 问 时 间 的 整 别 全 更 去 ， 

十 习题 6.3 

ФИ ЕЕ dea E FE А E MEN (以 ms 3 di y 







EH 33 
Tovg asi 


BP ШР E LE. t 


IBS E AL Hh 

КПА ЭП АГНЕ, ШШЕН АМИ. Hi RG, ШЕШЕНЕ. D D 
ааа Т ок ДЕ. ЖЕНЕН ЖЕ LIT RE Ы b IRE КАНЕ UE DER). 86 
TA ы-і. RARA- t AEAEE. Kiiks. ШЕШН RIS (E 
PE) ИНЕҢ Ж. 

SAFRE г ШО НЕН. BOB TR ОЕ Н ES. BI ES 3 — 
Tür ВА Eq E. iN THEMES. paa FERT FERT Hbi eR. ЕВЕ 
THRE- GE. HERE. BE) їл. СНЕ Hi T ИЕК. dua 
МИНТЕ ЫАЛ sc. W DO Xx BRUN, ИС ЕН DO X F. W DO don 
iir foret И ЫЕ Е-Е, ЖЕРЕ IE DER ERE n, 


ЯН Sida d EN . 

ШЕ кил, толинажникаікт, i en des 4 bu x A E E 
em, ЖЕ ҖЕН lei nT, ПА ДФО ФИИ Е - ШЕЕ. ЖҮР 
-PERERA ЕТ. ги nies ДЕ, ЯДА ФИА МЕБ, Иш 
ы к ЕТЕ E4522 


ihi fs] a ar 
REEE KEE. d. OE ЖЕ ЕРИП e ТЫМ Intel 的 PCI 
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Intercçonneci, ВЕЕ о ДНН UO HERR CPU 和 主 存 的 。 |] scie ИЕ р нң 
不 同 (它们 是 与 CPU 相 美的 }, 诸 加 PCI 这 样 的 IO i PER НЛ CPU Ж.Ш. PC RI Macintosh 
WS ELERI PCI E. 图 6.11 展示 了 一 个 典型 的 DO BSD CL PCT NH OO, RET CPU. 
ЮН OE. 


CPU 





шаң d 
р: 
| ” Д-Т 











USB Eom | | Енең 





И а ЧГ. 


Ебі АН, CHEM CPU. EANO gë 
If DO ЮЖ Bal i M e d їн ET up АН HU UB. Wm. 
(ЕН 6.11 rh, T PFE SSK HDH, 
* USB (Universal Serial Bus. 144 547.3 8 ) 控制 器 是 一 个 特 设 备 连 接 到 USB fits. USB 
的 奉 吐 率 可 以 法 到 12Mbits， АЕР ТТ ШЫ. ИШИ. НЫ. ШЫН 
Ша. ЖЫНЫ, Шан. CD-ROM Ea ТЕТ. 
. ШЕТ (ШШЕН) ЧТИ ИНЕШ. 它们 负责 代表 CPU СЕТИ ЕНЕ. 
г IH ЖЕ CPU кер 
此 他 的 设备 , Ишин, Д.Е КА. ЕРА ГЕТ iS F pip Т 以 而 连接 到 10 
电线 ， 这 些 捅 榴 提 供 了 到 总 总 的 直接 电路 连接 。 
"mde IQ B dr Rim T (ES ELE infi bt EF РЕ, 超出 了 我 们 讨论 的 范围 ， 外 是 
TIR EHE — TECE SE. Мы. Mal GTH CPU Wan ИЕН Spe. 
CPU fF] — HW 3 Н sh ІС (memory-mapped IO) 的 技术 来 向 VO ird Ned dre, bmp 
5.12 (a) Жа. ШҮ ШЕЕ UO 的 系统 中 ， WES npn fp —3АН ROS 5 vo WAN n 
的 。 每 个 这 样 的 地 址 称 为 一 个 voo (10 роп). АЕА А, SHEET 


402 ЕТЕ 





ПАК СЕКЕ 13 E E п), 





газ CPU МОНАР. ДАН ОТУ ВА НАНЕ СШ ЕЕ HEEL АВЕ, EE Tat 
CPU и 





(b» РЕТ А. HATEEN DMA fex 


Au BER d _ 408 





CPU $4 





ic) $ ОМА REAN BARNAU IR EAD CPU 
E512 W- TEENS 

TAX Т] АР И ШЕШЕТШ ДНП Ox. ME. CPU 可 能 通过 执行 三 个 对 地 
4 Oxa НАҒЫЗ», ЖЕШ. 第 一 条 指 他 是 监 送 一 个 合 地 字 ， 它 告诉 赤 盘 发 起 一 个 读 ， 还 发 送 
ТИЛЕН. {ИШ АП УНИН. ЖЕ ЧЕТ CPU (ІНЕ 8.1 РИНЕ), ЖЖ ЕШ 
ATIS. Ж — 5% 88 RE IP DS dr hui t EC АЯ ЖЕ L Fih. 

“ CPU 发 起 了 请 求 之 后 ， 在 磁 者 执行 读 的 时 候 ， 它 通常 会 做 些 其 他 的 工作 。 回 起 一 下 ， 一 个 
IGHz 的 处 理 器 时 钟 周期 为 ms， 在 用 来 读 和 三 盘 的 Тепа» 时 间 里 ， 它 沫 在 地 可 能 执行 1600 万 条 指 地。 
在 忧 输 运行 时 ， 只 是 简单 地 等 桂 ， 什 笃 都 址 矢 ， 是 一 种 极 大 的 液 费 。 

在 磁盘 控制 器 收 到 来 自 CPU 的 该 而 他 之后, CATHER ШІК ЯН НІК (КІН 
8. КА ЕНІНЕН ЕН, PEE СРО HTA, mela 00 Ил. ETUR Ае, 
执行 省 或 者 写 总 线 事 务 ， 而 不 需要 CPU ЖЕЕ. Ж; ИМА (direct memory access, ËA An 
Бур] index Y DMA fig (DMA transfer), 

(Е DMA "ОЗЕР, BESEBIX P Te EE Tr Fra ZEE IP ELE, SERO USA SES CPU ЗЕ 
"Pepsi 9 ЖШ CPU. ff 612 (с) 所 示 。 基 本 思想 是 中 断 佐 发 信 号 到 CPU 芯片 的 一 个 外 部 
管 丢 上 。 这 会 导致 CPU 暂 迟 它 当前 正在 巾 的 工作 ， 跳 转 到 一 个 提 作 系统 函数 。 这 沾 函 数 会 记录 下 
UO 已 评 完 成 ， 航 后 将 榨 制 返回 到 CPU ЖЕ ИЛ. 
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很 有 用 的 工具 ， ЖЖ DiXImc, CARANE + SCSI Bi d Hd oi ина E[68]. 494, DIXtmc 
Б ЖЛЕ AAT is) ПАНЫН, блай, АЕ T ERG 11 小 区 中 
М1, KTREDPARRKE. ИНИН ФАНИ ИНИН EE, pd Papas ЮН. 
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XB: DiXmc [15585 S aaa r T Ава]. 


R^EBKi—PXT—ERTIBMBEHGANE X. Fk, РАНЕ (ЕРЕ) 比 
Кб ЖЁН, Ж, ALAETH ИЯ (Жл BEET) du m 
HAREA- ENERE, bR-— ÑE LHILRHATRT, NARH Даана ЕР 
THR ТЕНГ НФ Е k. Fu, АТЖ, ДН TIR BEAR AED A RE 
一 个 更 简单 的 接口 ， ЧЕНЕН-жы) ЧЕНА ЫН Rai, RANEE IUE E ERA 
МЕКЖЕЖЕНТЕ, аан ЖОМЕ К Б. 
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6.13 存储 技术 趋势 

从 我 们 对 存储 技术 的 讨论 中 ， 可 以 总 结 翰 拖 个 很 重要 的 思 杷 ， 

。 不 同 的 存储 技术 有 不 同 的 价格 和 性 能 折 中 。 SRAM H. DRAM 快 一 点 ， 而 DRAM ШЕ 
快 很 多 。 另 一 方面 ， 快 速 存储 总 是 比 慢 速 存储 缆 贵 前 。SRAM ST T iit Ete DRAM В, 
DRAM 的 造价 又 比 磁盘 高 得 多 ， 

. 不 同 存储 技术 的 价格 和 性 能 属性 以 截然 不 同 的 速率 变化 着 。 斤 6.15 总 结 了 从 1980 年 以 来 的 
存储 技术 的 性格 和 性 能 属性 ， 最 早 欧 PC 是 那 一 年 提出 的 , 这 些 数字 是 从 以 前 的 贸易 杂记 中 
挑选 出 来 的 。 虽 然 它 们 是 从 非 正 式 的 调查 中 得 到 的 ， 但 是 这 些 数 字 还 是 能 揭 冰 出 -: 些 有 趣 
的 趋势 的 。 

& M 1980 年 以 来 ，SRAM 技术 的 成 本 和 性 能 基本 上 是 以 相同 的 速度 改善 的 。 访 疝 时 
[B] FEE [A 100 fi. 而 每 兆 字 节 的 成 本 下 降 了 200 倍 , 如 图 6.15 (а) 所 沙 。 不 过 ，DRAM 
和 磁盘 的 变化 更 大 ， 而 且 不 一 致 。DRAM 每 兆 字 节 的 成 本 下 降 了 8000 倍 所 小 几乎 是 四 个 
ЖШ), ІШ DRAM 的 访问 时 间 只 下 隆 了 大 约 5 倍 ， 如 图 615 (b) 所 示 ， 磁 盘 技 术 有 和 
DRAM 相同 的 趋势 ， 其 至 于 变化 更 大 ,从 1980 年 以 来 ， 磁 盘存 储 的 每 兆 字 节 成 本 增长 了 
50 000 НЕНІ», FUB 104524, ШЕ 6.15 (с) 所 示 。 这 些 惊人 的 长 期 
Fa SSE H Т {ТЇЙ е ИИК ТАНЫ: 增加 密度 〔 从 而 降低 成 本 ) 比 降 低 访 问 时 
间 更 容易 。 

° DRAM fX Si Ej AES CPU 时 钟 周 期 时 间 。 正 如 我 们 在 图 5.15 GD 中 看 到 的 那样 ， 
从 1980 年 到 2000 *E, CPU 时 钟 周期 提高 了 600 倍 。 相 比 于 CPU PEBE, SRAM 的 性 能 是 稍 
的 ， 尽 管 SRAM 的 性 能 在 保持 增长 。 然 而 ，DRAM 和 磁盘 性 能 与 CPU 性 能 之 间 的 差 路 
实际 上 是 加 大 许多 。 图 6.16 清 楚 地 表面 了 各 种 趋势 ， 以 半 对 数 为 标 度 〔semi-log scale), iii 
出 了 图 6.15 中 的 访问 时 间 和 时 钟 周 期 。 
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图 616 DRAM. ERI CPU 速度 之 间 逐 渐 增 大 的 差距 


正 刀 我 们 将 人 在 6.4 НЫН, 现代 计 算 机 频繁 昌 使 用 基于 SRAM ІІ, CURRERE 
理 锅 - 行 储 器 之 间 的 差 趴 。 这 种 方法 行 之 有 效 是 因为 应 用 程序 的 一 个 称 为 局 部 性 《locality) 的 基本 
属性 ， 接 下 来 我 们 就 讨论 这 个 问题 ， 
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一 个 编号 民 好 的 计算 机 程序 倾向 于 展示 出 良好 的 局 部 性 【iocality )。 也 就 是 ,它们 倾向 于 引用 
的 数据 项 邻近 于 其 他 最 近 引 用 过 的 数据 项 ， 或 者 邻近 二 最 近 白 我 引用 过 的 数据 项 。 这 种 倾向 性 ， 
HERA БАВЕ Ж (principle of locality)， 是 一 个 持久 的 概念 ， 对 硬件 和 软件 系统 的 设计 都 有 着 极 
大 的 影响 。 

局 部 性 通常 有 岗 种 形式 ， 时 间 局 部 性 (temporal locality) 和 空间 局 部 性 《spatial locality). ZE- 
个 具有 民 好 时 间 局 部 性 的 程序 中 ， 被 引用 过 一 次 的 存储 器 位 置 很 可 能 在 不 远 的 将 来 骨 被 多 次 引用 ， 
化 一 个 具有 良好 字 间 局 部 性 的 程序 中 ， 如 昌 一 个 存储 器 位 置 被 引用 了 -~ 次 ， 那 么 程序 很 可 能 在 不 远 
的 将 来 小 用 附近 的 个 存储 器 位 置 。 

各 序 员 应 该 理 解 局 部 性 原理 ， 因 为 一 般 而 言 ， 有 良好 局 部 性 的 程序 比 局 部 性 差 的 程序 运行 得 
归 快 。 现 代 计 算 机 系统 的 各 个 层次 ， 从 癸 件 到 操作 系统 、 到 应 用 程序 ， 它 们 的 设计 都 利用 了 局 部 
性 。 信 硬件 层 ， 司 部 性 原理 允许 计算 机 设计 者 通过 引入 称 为 高 速 缓存 存 储 器 的 小 而 快速 的 存储 由 
来 保 他 最近 被 引用 的 指令 和 数据 项 ， 从 而 提高 对 主 存 的 访问 滞 度 。 在 操作 系统 级 ， 局 弟 性 原理 允 
证 系统 使 用 主 存 作为 奸 拟 地 址 空间 最 近 被 引用 块 的 高 速 缓存 。 类 似 地 ， 操 作 系 统 用 主 存 来 当 存 磁 
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Bb CAE А ЕН БО ЖЕЙ И ТИНА. ЖАКЕ А НЕ ТЕ ЛҮ НЕР yr rh B УЙИ Ж АС ВА Е. 例如， 
Web 3| 36 ДЕ ЖЕШСЕ И ОЛІМ ОНО ЖАШ Б, ИШЕ ЖЕНЕ БИ. ХЕ Web 服务 器 将 
БОНН ЕТЕ ШЕН КЕ р. ХЕ fp ge ӘЛЕ ОН ІН Ж, ПОТЕ ERA 
器 的 任何 上 涉 ， 


6.2.1 对 程序 数据 引用 的 局 部 性 

ЖҮЗІК 6.17 (а) 中 的 简单 前 数 , 它 对 一 个 向 量 的 所 有 元 央求 和 。 这 个 程序 有 良好 的 局 部 性 吗 ? 
为 了 回答 这 个 阿 题 ， 我 们 来 看 看 每 个 变量 的 引用 模式 。 在 这 个 例子 由， 变量 sum 在 每 次 循环 选 代 中 
楼 引用 一 次 ， 因 此 ， 对 于 sum 来 说 ， 有 好 的 局 部 性 。 另 - 方面， 因为 um 是 标量 ， 对 于 sum 来 说 ， 
没有 空间 局 部 性 ， 

正如 我 们 在 图 6.17 (b) PRAK: WE v 的 元 素 尾 被 顺序 读 中 的， 一 个 接 一 个 ， 按 限 玄 们 存 
侍 在 存储 器 中 的 顺序 〔〈 为 了 方便 ， 我 们 假设 数组 中 从 地 址 0 开始 的 )。 因 此 ， 对 于 变量 vy， 函 数 有 和 根 
好 的 空间 局 部 性 ， 但 是 时 间 局 部 性 很 莽 ， 因 为 每 个 向 量 元 素 只 被 访问 一 次 。 因 为 对 于 循环 体 中 的 每 
个 变量 ， 这 个 函数 要 么 有 好 的 空间 局 部 性 ， 要 么 有 好 的 时 间 局 部 性 ， 所 以 我 们 可 以 断定 sumvec M 
数 有 良好 的 局 部 性 。 


int sumveciint v[N]) 
{ 


int i, sum = 0; 


аша += viil; 


l 
2 
3 
4 
5 for (i = Ü; 1 < N; i++) 
2 
7 return sum; 

8 





(h) 


图 5.17 (а) 一 个 具有 良好 局 部 性 的 程序 ; (b) 向 量 v 的 引用 模式 (N = 8) 
注意 如 何 按照 向 量 元 素 存 储 在 存储 器 中 的 顺序 来 访问 它们 ， 


我 们 说 像 sumvec XXTENSUT VIR] -个 向 量 每 个 元 素 的 函数 ， 具 有 步 长 为 1 的 引用 模式 【stride-1 
reference pattem) 相对 于 元 素 的 大 小 )。 访 回 一 -个 连续 的 问 量 的 每 第 лж. ИШКА KO k 
的 引用 模式 【stride-k reference pattern)。 步 长 为 1 的 引用 模式 是 程序 中 空 忆 局 部 性 常见 和 重要 的 来 
源 。 一般 而 言 ， 随 者 步 长 的 增加 ， 空 间 局 部 性 下 降 。 

灶 于 引用 多 维 数组 的 程序 来 说 ， 步 长 也 是 一 个 很 重要 的 问题 。 考 虑 图 618 GO 中 的 函数 
sumarrayrows, x 一 个 二 维 数组 的 元 素 求 和 。 双 重 循环 按照 行 优 先 顺序 (row-major order) 读数 组 
的 元 素 。 也 就 是 ,内 层 循环 读 第 一 行 的 元 素 ,， 依 此 类 推 , 函数 sumarrayrows 具有 良好 的 空间 局 部 性 ， 
因为 它 按 照 数 组 被 存储 的 行 优先 顺序 来 访问 这 个 数组 ， 如 图 618 (tb) 所 示 。 其 结果 是 得 到 一 个 很 
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好 的 步 长 为 上 的 引用 模 成 和 和 且 好 的 空间 局 部 性 。 


1 int sumarrayrowsiint a[¥][N]} 
2 { 

E int i, 1, sum = 2; 

4 

» for {1 = 0; i < M; 1++) 

6 for (J = Ü; J < N; J++) 
7 sum += а[1][1]; 

Ü return sum; 

9 } 










= pod dll 
ib) 


图 6.18 (а) 另 一 个 具有 良好 局 部 性 的 程序 ; (D) 数组 o 的 引用 模式 (Mz 2, N = 3j 
БОЕ ар НЕВЕ, Ж ИУ ОЙ ЕН ЫЕ riba GAS ИИК АЛИК RAR ЙЧ 


-一些 看 上 上 去 很 小 的 对 程序 的 改动 能 够 对 它 的 局 部 性 有 很 大 的 影响 。 例 如， 图 6.19 (а) PHAR 
sumarraycols 计算 和 图 6.18 (а) "Pa XX sumarrayyuws PERA R. E AKARE TiM) 
的 循环 。 这 样 交 换 特 环 对 已 的 局 部 性 有 何 影 利 ? 

EERTE А РЕА Е T В #0 sumarraycols， 因 为 它 按照 询 来 扫描 数组 ， 而 不 是 接 照 行 。 内 为 地 
数组 在 存储 器 中 是 按照 行 来 存放 的 ， 结 果 就 得 到 步 长 为 人 X sizeoffinb) 的 引用 模式 ， 基 图 6.19 (b) 
ВТ As. 
int sumarraycolsiint a[M][N]) 


i 


int 1, |1, sum = 0; 


For (j = 0: J < N; 1-%) 
for {1 = Ü; 1 « M; i++) 
sum += а(11(11; 
return sum; 


ud CO —] ЄТ ОЛ Ша n bo 一 


тера ра раа ара 





ШШ == | БЕН ЕРЕН Ett 


(b 


8619 (a) 一 个 空间 局 部 性 很 差 的 程序 ; (0) 数组 G 的 引用 模式 (M 2, N73) 
EC A Re НЫН ж, iX ESOS Tz [E RI ЖЕ АМ X sizeoltint)) 的 引用 模式 来 扫 措 存储 器 。 


| Lu ITI. 409 
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622 ШЕФ mat 

W ANBI rik FEE BP. CPU ДЫҢ (ЧЫН) ЗЕ, КЫПЫН ЕЕ 
一 个 程序 基于 取 指 他 的 局 部 性 ， 例 如， 图 6.17 中 for ИМЕН НІН Ж ЖЕ ЖЕШ НЕНІҢ 
行 的 ， 固 此 往 环 有 良好 的 室 间 局 部 公 。 因 为 精 环 体会 被 执行 老 演 ,所 以 它 也 有 想 好 的 时 间 局 部 性 。 

代码 区 别 于 程序 数据 的 一 个 重要 属性 是 在 运行 时 它 是 不 能 被 修改 的 。 当 程序 正在 执行 时 ，CPU 
Hh M fe EEH EAR +. CPU 贝 和 不 会 重 写 或 修改 这 些 指 专 。 
623 局 部 性 小 结 

放 基 一 节 中 ， 我 们 褒 细 了 局 部 性 的 基本 思想 ， 还 给 出 了 一 些 量化 评价 一 个 程序 中 局 锅 性 的 简 音 
不 则 : 

. 重复 引用 同一 个 变量 的 程序 有 良好 的 时 间 局 部 性 ， 

ОРАР К 的 引用 模式 的 程序， 步 长 越 小 ， 空 间 局 部 性 越 好 。 上 内 有 步 长 为 | 0931 

用 模式 的 程序 有 入 好 的 空间 局 郭 性 。 在 存 情 回 中 以 大 步 长 跳 来 跳 去 的 程序 空间 局 部 性 会 


(ЭС, 
ОРИЧ Ж. ЖЕНЕ ӘННЕН. ЯНА, АЕ А E. БЕ 
тан. 


HEREN. (ІП ЛТ AE HM BELR ENTIER SET ERIS. PE НЕ ctn 
用 高 束 温 存 厨 中 率 和 不 命中 率 来 量化 局 部 性 的 概 镶 。 你 还 会 弄 明白 为 什 笃 有 良好 局 部 性 的 程序 通常 
比 局 静 性 莽 的 程序 运行 得 更 快 ， 垦 管 如 此 ， 了 骨 如 何 看 一 眼 村 代码 就 能 蓝 提 对 程序 中 局 部 性 的 高 闻 
感 货 ， 是 程序 员 要 掌握 的 一 项 有 用 而 且 重 要 的 技能 。 

ЖУЛИ 6.4 

„наст Б ЕЕ: ЖЛЕ ТОС dd = ТҮ а, 

| int sšumarray3diint a[M][N][N]] 


2 [ 

3 int i, j, К, Bum = 0; 

4 

5 [ӨР (1 = D; l < N; i++) 1 

Ё for ij = 0: j < N; j**) Í 
7 tor [k = 0; k < N; k++*) í 
H gum += a[k] [1] [3]: 
8 i 

10 ] 

11 ] 

12 return Bumi 

11 } 

М 6.5 


H 620 Pd КАВ, ИИИ Б НН, ФИТА ede, Жэ kakuna 
Bibi. MATO ЕЕН ЫНЫ EO, 


410 %5% 


1 void clearlípoint *p, int n) 

2 Í 

3 int i, j; 
1 — &define N 1009 4 
2 5 for {1 = 0; j < n; іж) Í 
3 typedef struct { б for 0 = 0; J < 3; j++) 
1 int vel[il; 7 e[ij.vellj] = 0; 
3 int a-c[3]; В Lor P 0; J < 3: J++} 
5 ! point; 9 p[il.acc[j] = 9; 
7 10 ) 
8 point рім]; 11 } 

Га) structs 数组 ( b) elear] ЮЖ 
| | ñ | 

1 void clear? (point *p, int n} 1 void clear3 (point *p, int m) 

2 1 
2 1 | | | 
3 int i, 3; 3 int 1, J; 
4 4 
5 for (iz 0; і < n; i++) 1 . for 5 n < ^ j++) ( | 
Ó for (j = Or j < 3; jel io 2 or li = un n de 
[ pfil.vel[j] = 0; РІ11.че1121 = 0; 

. B tor іі = D; 1 < rn: 144) 
d p[il.acc[j] = 0; | | 
9 } 3 pl[ij.acc[3] = 0; 
11 i 11 l | | 
(c) скар Bs d) cicar3 В 


8620 2488 6.5 的 代码 示例 
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6.1 17162 ПАИ ГЕНТ ЕА T ERE BS] RUE АҚ: 
"ABE BE BENI BA. HARRER ZTT INT DAS E E SEHE 9 0 ERR 
m HEU. CPU RI X EZ BI) RE EXE ВТЕ K. 
. М UREM T IR ВАН. 
WEBOKMD—PMERAPISER.S ЖЕ ЖК IX АКЕН НАК ЖЕНЕ. CAA Қ. 
补充 的 性 质 使 人 想到 … 种 组 织 存 储 器 系统 的 方法 ， 称 为 存储 器 县 次 结构 (memory hierarchy), Erf 
的 现代 计算 机 系统 中 部 使 用 了 这 种 方法 ， 图 6.21 展 沙 了 一 个 典型 的 存 情 器 层次 结构 ， 

- 般 而 吾 ， 从 高 屋 往 底层 走 ， 存 彤 设备 变 得 更 慢 ， 更 便宜 和 更 大 。 在 晤 商 层 (10). БРЕЙ 
快速 CPU 寄存 器 , CPU 可 以 在 一 个 时 钟 周期 内 访问 它们 。 接 下 来 是 -一 个 或 多 个 小 型 或 中 十 的 基于 
SRAM Ёар, ВИДЕЛ, ЛУ СРО 时 钟 周期 内 访 避 它们 。 然 后 是 一 个 大 的 基于 DRAM 
的 十 在， 可 以 在 几 十 或 玫 百 个 时 钟 周期 内 访问 它们 。 接 上 来 是 慢 速 但 是 容量 很 大 的 本 地 磁盘 ， B 
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RH. HREMEBRISI-—INIEEIERESS LES. WAARHEEN. fim, ix 
gH Ex (AFS) 或 者 网 阁 立 性 系统 (NFS) ix MERI HUE IE ЕН. КҮҮ up ERE 
inf REESE EET. HEU. HEN fo RTI Fa] ril E i ЕЕГ НА 2 АЈ Web 服务 器 
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HA. MEF (cache, ТЕТЕ “саһ”) 是 一 个 小 而 快速 的 存储 设备 ， 它 作为 存 信 在 更 大 、 
也 更 慢 的 设备 中 的 数据 对 象 的 缓冲 区 域 .使 用 高 速 埠 存 的 过 程 被 称 为 规 存 (teaching, Ey cashing”). 

{Г e m quom eg. GTT ST k EPS h PROF RE PE ET kel E 
НИН kw wer ЕЙ. Mh. Imm -БИЗНЕЖНЯНЕ Е Е. 
P. deb ETE А ELEC FARLO HL] wit (Brin Web WEAD ШЕН, Жүр А ЖИЕ 
LENSES. Xm. BBC THE СРО ERE. 

Н 6.22 Ios ТИЕ КЕЗЕНІ WFE. ЖЕН EE EE | o nc НЕ КЕ НЕ] 
ӨҢІН (chunks), ЛЯ (blocks). BAREA — THE Miele. xn TIMES. H 
T EL JE Br К.С Е РЕА), 也 可 以 是 可 变 大 小 的 [例如 ,存储 在 МНЕ КЮ HTML 
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Xf». ӨШ, [E 622 中 第 kel 2 eb REI 16 T CAE ih, $98 529 0-15. 

Жын, ВЕКБИТИИЕН ЫНАН hi Б, STRE АУМ kl ЕНІН ATE. 
在 任何 时 刻 ， 第 上 居 的 缓存 包含 第 kal 层 块 的 一 个 子 集 的 拷贝 。 fl. ҒЕ6ОФ, ЖК ЫП 
有 4 个 块 的 空间 ， 当 前 包含 所 4、9、14 83m. 

数据 总 是 以 块 大 小 为 伟 送 单元 【ifansfer unit) (Е k EAS kH HAET. 虽然 在 层 
次 结构 中 任何 一 对 形 邻 的 屁 次 之 间 块 大 小 基因 定 的 ， 但 是 其 他 的 层次 对 乙 亲 可 以 有 不 同 网 卖 人 小 。 
ІШ, “ЕН 621%, LIR LO 之 间 的 传送 通常 使 用 的 是 1 个 字 的 块 。1L2 和 Ll 之 间 (以 及 L3 AU L2 
ІҢ) ЖЖ s BH Y E 4-8 个 字 的 块 。 而 L4 和 L3 之 间 的 传送 用 的 是 大 小 为 几 百 感 儿 薄 字 三 
(un. О, BRAE RIH ON CPU Eo 的 设备 的 访问 时 间 较 长 ， 因 此 为 了 补 杰 这 些 较 
长 的 访问 了 时间， 倾向 于 使 用 较 大 的 块 。 


mr- ЖұРІН)», mk. жы 
E kE Dao | 3 | 名 在 着 第 k+l ран ATA 
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图 5.22 存储 器 层次 结构 中 一 个 基本 的 缓存 原理 


缓存 命中 

当 程 序 第 要 第 k+1 层 的 某 个 数据 对 象 4 时 ， 它 首先 在 当前 存储 在 第 k 层 的 “个 坎 中 查找 49。 如 
қала 6 к ЕТ, 那么 就 是 我 们 所 灌 的 组 奉命 中 《cache hit), ЖЕНА KZ ER d, 
根据 存储 器 层次 结构 的 福 质 ， 这 要 比 从 第 kel pik 4 更 快 。 例 如 ， 一 个 有 良好 时 间 局 部 性 的 程序 
可 以 只 换 14 中 读 出 一 个 烽 据 对 象 ， 得 到 一 个 对 第 k ИЕН И. 


缓存 不 命中 

另 一 方面 ， 如 果 第 k 尼 中 没有 缀 存 数据 对 象 d， 那 么 就 是 我 们 所 说 的 狂 存 不 命中 Lcache miss), 
HAER ЛН ВЕ, B k ERRITAR k 层 缓存 中 到 出 包含 ӘЖ, WRA k ШГП 
ӨГ, НЕ С ON CA RE) ГД. 

fu ОТЫН МАН ЕДЕН (replacing) 或 驱逐 (evicting) 这 个 块 。 坡 驱逐 的 这 个 块 
有 时 也 被 称 为 牺牲 块 (vicüm block)。 决 定 该 替换 哪个 块 是 出 组 存 的 玲 换 策略 及 控制 的 。 例 如 ， 
个 具有 随机 蔡 换 策略 的 缓存 会 随机 选择 一 个 牺牲 块 。 一 个 具有 最 近 最 少 被 使 用 《LRU,) MYS CERA 
缀 他 会 选择 那个 最 后 被 访问 的 时 间距 现在 最 远 的 块 。 

ЖК 抬 缓存 从 第 kel 屋 取 出 那个 块 之 后 ， 程 序 就 能 像 前 面 FAR к 层 读 出 d f. BUD, fe 
图 6.22 小， 在 第 上 层 串 读 忆 12 中 的 个 数据 对 象 ， 会 导 玻 一 个 缓存 不 命中 ， 因 为 块 12 当前 不 在 第 
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k gu. HEH 12 从 第 k+l EF Ip K 层 之 后 ， 它 就 会 保持 在 那里 ， 等 特 稍 后 的 访问 。 


缓存 不 命中 的 种 类 

长 分 不 同 种 类 的 缓存 不 合 中 有 时 候 是 很 有 帮助 的 。 如 果 第 kk 层 的 组 存 是 空 的 ， 那 么 对 任何 数据 对 
象 的 访问 都 会 不 命中 。 一 个 空 的 缓存 有 时 被 称 为 冷色 存 (cold cache)， 此 类 不 命中 被 称 为 强制 性 示 命 
中 (compulsory miss》 或 冷 不 命中 cold miss)。 冷 不 命中 很 重要 ， 因 为 它们 通常 是 短暂 的 事件 ， 不 会 
在 稳定 状态 中 出 现 ， 稳 定 状态 指 的 就 是 在 反复 的 存储 器 访问 已 经 将 缓存 变 赃 【warmned ир) 了 之 后 。 

RERET МВТ, ЖК ЕШ ИИ r ЖЛ S 4k k 5, 确定 把 它 从 第 k+1 层 中 取出 的 块 
放 存 哪里 。 最 灵活 的 替换 策略 是 允许 来 自 第 kl 层 的 任何 块 放 在 第 k 层 的 任何 块 中 。 对 于 存 情 器 层 
IK J БЕН Н GEI CPU)， 它 们 是 用 硬件 来 实现 的 ， 而 且 速 度 是 最 优 的 ， 这 个 策略 实现 起 
来 通 前 狠 帅 贵 ， 因 为 随机 地 放 署 块 ， 定 位 起 来 代价 很 高 。 

因此 ， 和 硬件 缓存 通常 重用 汐 是 更 严格 的 放置 策略 ， 这 个 策略 将 第 k+1 层 的 某 个 抉 限制 放置 在 第 
КЕГЕН СВА). И, ЕЕ 622 中 ， 我 们 可 以 确定 第 kel HHH i 
必须 放置 在 第 k 层 的 块 (imod 4) 中 。 枫 如 ， 第 k+l 层 的 块 0、4、8 和 12 会 映射 到 第 kk 层 的 块 0， 
Ж 1. 5. 95113 会 映射 到 块 1， 依 此 类 推 。 注 意 ， 图 6.22 中 我 们 的 示例 组 存 使 用 的 就 是 这 个 策略 。 

这 种 限制 性 的 放置 策略 会 引起 一 种 不 命中 ， 称 为 冲 宾 不 命中 《conflict miss}， 在 这 种 情况 中 ， 
组 人 足够 人 ， 能 够 保存 被 引用 的 数据 对 象 ， 但 是 内 为 这 些 对 和 象 会 映射 到 同 -- 个 缓存 块 ， 组 存 会 一 直 
不 命中 。 例 如 ， 在 图 和 .22 中 ， 如 里 程序 请 求 块 0， 然 后 热 8， 然 后 块 0， 然 后 典 8， 依 此 类 推 ， 在 第 
k 层 的 缓存 中 ， 对 这 两 个 块 的 每 次 引用 都 会 不 盖 上 中 ， 即 使 是 这 个 组 存 总 共 可 以 容纳 4 个 块 。 

ТЕЕ S ЖЕНЕ ЖИЕ (ОШ. ЯНО 来 运行 的 ， 每 个 阶段 访问 缓存 块 的 某 个 相对 稳定 不 
变 的 集合 。 例 如 ， 一 -个 幅 套 的 循环 可 能 会 反复 地 访问 同一 个 数组 的 元 素 。 这 个 抉 的 集合 被 称 为 这 个 
МЕМЛЕ (working set)。 当 工作 集 的 大 小 超过 缓存 的 大 小 时 ， 缓 存 会 经 历 容量 不 命中 【capacity 
Immiss)。 换 同 话说 ， 组 存 就 是 太 小 了 ， 不 能 处 理 这 个 工作 集 。 

ЕЖЕН 

正如 我 们 提 到 过 的 ， 存 情 器 层次 结构 的 本 质 是 ， 每 一 层 存储 设备 都 是 较 低 一 层 的 缓存 。 在 每 -- 
层 上 ， 茶 种 形式 的 诸 辑 必须 管理 缓存 。 这 里 ， 我 们 的 意思 是 指 某 个 东 贞 要 将 缓存 划分 成 块 ， 在 不 同 
的 屋 之 间 桂 送 块 ， 判 定 是 命中 还 是 不 命中 ， 并 处 理 它们 。 管 理 妈 存 的 逻辑 可 以 是 硬件 、 软 件 ， 或 是 
两 者 的 结合 。 

例如 ， 编 详 器 管理 寄存 器 文件 , 缓存 层次 结构 的 最 高 层 . 它 决定 当 发 生 不 命中 寺 何 时 发 射 加 载 ， 
以 及 确定 哪个 寄存 器 来 存放 数据 。L1 和 L 层 的 缓存 完全 是 由 内 团 在 缓存 中 的 硬件 逻辑 来 管理 的 。 
在 一 个 有 虚拟 存储 器 的 系统 中 ，DRAM 主 存 作为 存储 在 磁盘 上 的 数据 委 的 缓存 ， 是 由 操作 系统 软件 
和 CPU 上 的 地 址 翻译 硬件 共同 管理 的 。 对 于 -个 具有 像 AFS 这 样 的 分 布 式 文件 系统 的 机 器 来 说 ， 
本 地 磁盘 作为 缓存 ， 它 是 出 运行 在 本 地 机 器 上 的 AFS 客户 端 进程 管理 的 。 EKLARE, REA 
自动 运行 的 ， 不 需要 程序 采取 特殊 的 或 显 式 的 行动 。 


632 存 情 器 层次 结构 概念 小 结 


慨 括 来 说 ， 和 存储 器 层次 结构 行 之 有 效 ， 是 因为 较 慢 的 存储 设备 比较 快 的 存储 设备 更 便宜 ， 还 因 
为 程序 倾向 于 展示 局 部 性 ; 
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« 利用 时 间 局 部 性 ， 根 据 时 间 局 部 性 ， 问 - REO ЛЛЕЕЕЖІМЕН. B — АА 
在 第 一 次 不 命中 时 被 挡 见 到 缓存 中 ， 我 们 就 会 期 望 后 惫 对 该 日 标 有 一 系列 的 访问 命中 。 因 
为 缓存 比 低 “ 层 的 存 销 设 务 更 快 ， 对 后 面 的 命中 的 服务 会 比 最 开始 的 不 命中 快 很 多 。 
. 利用 空间 局 部 性 抉 通 种 包含 有 多 个 数据 对 象 。 根 括 空 间 局 部 性 ， 我 们 会 期 电 后 面 半 虚 顽 
中 其 他 对 象 的 访问 能 够 补偿 不 命中 后 拷贝 该 块 的 花费 。 
现代 系统 中 到 处 都 使 用 了 缓存 。 正 如 从 图 丘 23 中 能 够 看 到 的 那样 ，CPU GA. BRA. A 
式 文件 系统 中 和 万 维 网 上 都 使 用 了 缓存 。 各 种 各 样 硬件 和 软件 的 组 合 构成 和 管理 着 缓存 。 注 意 ， 图 
623 中 有 大 量 我 们 还 未 涉及 到 的 本 语 和 峭 与 。 在 此 我 们 包括 这 些 术 语 和 盎 与 是 为 了 说 朋 曲 无 抽 组 存 
是 什么 样子 的 。 
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6.28. REFERRI APEE 
TLB: ЖЕН CTransiaton Lookaside Buffer): MMU: 存储 路 管理 单元 【Memery Management Unit); 05: ЕЖ 
(Operating System; АҒ: KASERA ¿Andrew File System): NFS: РЕ (Network File System). 
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ИГЕН ЫК ЕЕ НВ — E. CPU 寄存 跟 、 主 DRAM JEDER RUE ETE GERE 
АХ, НТ СРО MERZER AKR, s i ЖІ CPU 寄存 器 文件 和 主 存 之 间 择 入 
了 一 个 小 的 SRAM fff, ЖАЛА йй C -级 缓存}。 在 现代 系统 中 ，L1 高 速 缓存 位 于 CPU 
AL Ghi. BETA bapedkd AO. inBl524 所 示 。L1 高 速 缓存 的 访问 速度 几乎 和 寄存 器 
一 样 快 ， 典 型 地 昆 1 个 或 2 个 时 钟 周期 。 

ШОН CPU Ж-Е 2.2 |а ВОВЕ ВЕЕ ЛЧ А, ЖАТ ЕТ 高速 缓存 和 主 存 之 间 叉 插入 了 一 个 
ЕЖЕН, MON L2 高 速 旨 在， 可 以 在 几 个 时 钟 周 期 内 访问 到 它 。 可 以 将 L2 高 速 缓存 连接 到 存储 器 总 
H, ЈЕ ВАЕ АСТЕ АР (ache bus), WE 624 所 术 。 有 些 高 性 能 系统 ， 例 如 闭 些 基 
T Alpha 21164 的 系统 ， 其 全 十 在 好 情 器 总 线 上 还 有 一 层 高速 绥 存 ， 称 为 L3 ФА, 在 层次 结构 中 
位 于 L2 而 速 织 椰 相 主 荐 之 间 。 星 然 在 安排 上 有 相当 名 的 种 类 ， 但 是 一般 的 永 则 都 是 一 样 的 。 


641 ЕНЕ IE EE ARR СЫ 
考虑 一 个 计算 机 系统 ， 其 中 每 个 存储 器 地 址 有 rm 位 ， 形 成材 = 站 个 不 同 的 地 址 。 如 图 6.25 (a) 
Рд, ВЕУ :个 机 器 的 疝 速 缓存 被 组 织 成 一 个 = 天 个 高 速 缓存 组 (cache sen 的 数 给， 每 个 给 包含 
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E TREAT (cache linc), 得 个 行 是 由 一 个 日 = > ТҮЙЕ» (block) ШІП, —1-Ж жуз 
суа bit? НА Fir ЖЇН REALE R. HOW rm {b+ ry TAE (бар bit) CACHER I 
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一 般 而 言 ， 高 速 组 在 的 结构 可 以 用 元 纽 CSEB nO 来 描述 。 高 速 缓存 的 大 小 【或 容量 )C 指 的 
ВТ ВЕ МОЯ, AO ES TAIFA. ЈЕ, C-SXEXB. 

当 一 条 加 载 指 令 指 示 CPU 从 证 存 地 址 4 中 读 - -个 字 时 ， 它 将 地 址 A K aw SUR EAE. ШЕН 
速 缓存 止 保 在 着 地 址 4 处 那个 字 的 拷贝 ， 它 就 立即 将 那个 宁 发 网 给 CPU。 那 么 局 速 缓 在 如 何 知 道 它 
ЖУА АННА 处 那个 子 的 撕 贝 的 呢 ? 高 速 缓存 的 结构 使 得 它 能 通过 简单 地 梳 合 地址 位 ， 发 现 质 请 
求 的 字 ， 类 似 于 使 用 极其 简单 的 险 希 清 数 网 哈 希 表 。 下 面 就 是 它 是 如 何 工作 的 ， 

参数 5 和 8 将 加 个 地 址 位 分 为 了 二 个 字段， 如 图 6.25 (b) 所 示 。4 中 5 个 组 索引 位 是 一 个 到 5 
个 组 的 数组 索引 。 第 一 个 组 是 组 0， 第 一 个 组 是 组 1， 售 此 类 推 。 当 作为 一 个 志和 罕 号 整数 解释 时 ， 组 
索引 位 告诉 我 们 这 个 字 必 须 存 储存 哪个 组 中 ， 一 旦 我 们 知道 了 这 个 字 几 须 放 在 哪个 组 中 ，4 中 的 + 
ЖАНМЕН jp СИЯНЫ ARATA. SERRARA AAM A% 
y Haie У abb A 中 的 标记 位 由 匹 配 时 ， 组 中 的 这 КЕТ. -有 旦 我 信 在 由 组 索引 标识 的 
组 中 定位 了 出 标 号 所 标识 的 行 ， 那 么 6 个 块 偏 称 位 给 出 六 在 BB 个 字 节 的 数据 块 中 的 学 偏 移 ， 

你 可 能 已 经 注意 钊 了 ， 夺 高 速 强 存 的 描述 使 用 了 很 多 符号 。 图 626x]p ex f T4. B 
你 参考 。 


组 数 

hj šB 8941 Ж 

Boo СЕР 

CETO 物理 地 址 位 数 


行 生 出 来 的 量 


下 储 器 地址 的 最 大 数 最 
y = logals} HEFE 
b = loga} Hee or 
гета +) 标 忆 位 数 
C=B x E x Š АЛЕ АИО ШШЕ КЕЧА ЛЖ {Р АЛ Cy) 





图 526 高 速 缓存 参数 小 结 


练习 题 6.6 


下 表 给 出 了 几 个 不 同 高 速 缓存 的 套数， 确定 每 个 高速 缕 序 的 高 速 缓 育 组 数 (S). iss CO 
组 索引 位 数 (3) МАЕ (В). 


атт | » | c вее |° 
ыр ү 
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642 ВНЕШНЕЕ ТТ 

IRE СЕНАТА ТЕ), ШИНИТЕ. ATRAI (E = 1) ЕШ 
Ж MS ddr ЕЕН Cdirectmapped cache) (S ШЇ 6270. Prim e fc fp IR ТЕМ 
EUREN, MAURISE SX IET CERTNEBESRANTAR ЕЖЕ. 


II i g | le- "Тү, 








82.27 直 控 号 射 高 这 经 存 (E=1) 
EARN 


假设 我 们 有 这 样 一 人 沾 系统 ， 它 有 一 个 CPU, 一 个 寄存 器 立 忻 ， 一 个 L1 BEST OTT ER. 
当 CPU 执行 一 条 读 存 诗 器 字 w 的 指令 ， 它 向 L1 高 速 缓存 请 求 这 个 字 。 如 果 LI ЖН 到 的 一 
PEREST. WARNA LI REA т, ЖИН ЕЛМЕН w КЕНІН CPU. # 
HAEREA Tip. 5L 高 速 缓存 向 主 存 请 求 包含 Ww 的 执 的 一 个 捷 内 时，CPU 必须 等 待 。 当 
Ж ue ne fr REM. L1 高 速 斌 存 将 这 个 块 存 帮 在 它 的 一 个 高 速 诅 存 行 里 ， ЖШ 
БЕРЕН. БЕЖЕЕНЕ СРО, ПЕ ТТЕ ARETE SEARE ERN T 
HHE, HASH: DAAR: GEE: (ОТЫН. 


PESER АТАНА 

фе — ра, ЖЕРЙ, ТИНЕ Р epe RR. | PARGI О TPE F — F 
HIACE EN. eaux. mE ОЗЕ ОЕА THX T HRS Н, MLA KIKI 
索引 位 就 是 一 个 到 这 个 数组 的 索引 。 图 所 28 Hos T ИЕК АЖЕН ИЕДИ f ТӨРІН. dix 
КӨС, {ЖАН 00001, 被 解释 为 一 个 造反 组 | HERET: 


i Hen 
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i1. i3: ЕД,» 

Brie ФАБИЯ ТИР а, ЕРЕ БЕТЕ ГУ Ш-Н 
在 组 i AAH- tA. ТЕО ТЕ, ОЕК, ШОН. BERNE Fl 
只 有 一 行 。 当 且慢 当 设 置 了 有 效 位 ， TAARAT КШ Б w 的 地 址 让 前 标记 相 匹 配 时 ， 这 一 
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行 中 包含 Ww 的 一 个 拷贝 。 

图 629 Rios T FLBEBRORS НИЕТ ЛЕ ЖЕНА ГЕН. МІН 7, БАЯ 
idco m М ШАНЫ АЧ. АЛАМ ВИНТТІ Hcc a bn АУ НІЛ, STELEE 
们 知道 我 们 想 要 的 那个 空 的 一 个 撞 贝 确实 存储 在 这 个 行 中 。 换 名 话说， 我 们 得 划一 个 缓存 命中 。 另 
方面 ， 旭 采 有 效 位 没有 设置 ， 或 者 标记 小 相 士 配 ， 烛 各 我 们 就 得 到 一 个 缓存 不 从中 。 


= 17 (1'b ME Ж. 






2 3 1 5 b T 


0 1 
(ГӘ Ге T I T ъ=) | 


{Зу cp moo 满足 ， 
EAS E FEES D UND 
(a5 itd ТЕ 
Yon . 


ЛА ЗТЯ (i): 


(ТТ =? 
x ip 0 E | 
的 标记 和 位相 苞 配 。 
t stir b Її 
| 0110. | i [| 16 | 
m-1 0 
Iud HR I2 i EE 


图 6.29 直接 映射 高 速 租 存 中 的 行 匹配 和 字 选 择 
(ORAE. wAn T w 的 低位 字 节 ，wi RETE. MOLISE 


RECS CREDO GERE 

一 旦 命中 , 我 们 知道 w 就 在 这 个 块 中 的 某 作 了 地方 。 最 后 一 步 确 定 所 带 坚 的 字 在 块 中 是 从 哪里 开始 
7. WA 6.29 所 六， 块 帆 称 位 问 我 们 提供 了 所 需要 的 字 的 第 一 个 字 和 他 的 偏 移 ， 就 像 我 们 把 高 速 缓存 看 
成 一 个 行 的 数组 一 样 ， 我 们 把 块 看 成 -个 字 节 的 数组 ， 而 字 节 偏 移 是 到 这 个 数组 的 : -个 索引 。 在 这 个 
йт, ЭЧИ ЈЕ 100, ERR w 的 找 册 是 从 块 中 的 字 节 4 开始 的 【我 们 假设 字 长 为 4 字 节 )， 


直接 映射 高 速 缓存 中 不 命中 时 的 行 赫 换 

如 果 高 速 缓存 不 命中 ， 那 么 它 需要 从 存储 器 层次 结构 中 的 下 一 苦 取 出 被 请 求 的 块 ， 然 后 将 新 的 
决 存储 在 组 索引 位 指示 的 组 中 的 一 个 高 速 缓存 行 中 。 一 般 而 吉 ， 如 果 组 中 都 是 有 效 高 速 缓存 邱 了 ， 
那么 必须 要 驱逐 出 一 个 现存 的 行 。 对 于 直接 映射 高 速 缓存 来 涪 ， 每 个 组 只 包含 有 - d. BRRR 
党 简单 ， 用 新 取出 的 行 丛 换 当前 的 行 。 


f: АТИН НАЯ 

ЕЖ СТТН КНЕ СТАТ ТВЕН НД ЕРЕ, АА ЛУНА EJ 
Р Гр. Ж, НО ОН ТТА ЕДВ A RS. АА ВЕЕ 
助 解释 清楚 这 个 过 程 。 假设 我 们 有 -个 直接 映射 高 速 缓存 ， 描 述 如 下 

GS, E, B m) -44,1,2,4) 

换 何 话说 ， 疝 速 缓 存 有 四 个 组 ， 每 个 组 一 行 ， 每 个 块 2 个 字 节 ， 而 地 址 是 4 位 的 。 我 们 还 假设 
每 个 字 邦 是 单字 市 的 。 当 然 这 样 - 些 假设 完全 是 不 现实 的 ， 查 是 它们 能 使 必 例 保持 简单 。 

如 采 你 初学 蜗 速 缓存 ， 列 举 出 整个 地 直 空 间 并 划分 好 位 ,是 很 有 帮助 的 ， 就 像 我 们 在 图 6.30 对 
我 们 4 位 的 示 罚 所 做 的 那样 。 关 于 这 个 列举 出 的 空间 ， 有 : 些 有 有 趣 的 党 情 值得 注意 ， 

* 标记 他 和 案 引 位 连 起 来 惟一 地 标识 了 存储 器 中 的 每 个 岂 。 例 如 ， 块 0 是 由 地 址 0 和 1 组 成 
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En НІЖЕНЕ2 Aa m. 23g 440 5 0, ЖНЖ. 
. 因为 有 8 个 存储 器 块 ， 但 是 只 有 4 TRER PARRA- Ra pin СӘ 
是 ， 它 们 有 相同 的 组 索引 ?7。 例 如,， 扎 和 和 4 ШЫҒАН 0, ЖЛ АЯЦ 1, 535, 
* ”映射 到 同一 个 高 速 女 存 组 的 块 由 标识 位 惟 -地 标识 . ЯШ, PO 的 标识 位 为 由 而 其 4 的 标 


iu 1 ЖІ 的 标识 位 为 0， 而 块 5 的 标识 位 为 1， 
[十进制 ) 
Ü 





СРЯ (El) (S22) 61) 
Ü Ü (0 





6.30 жон БН ЖЕТІ 4 位 地 址 空间 
让 我 们 来 模拟 一 下 当 CPU 执行 ЖАЛЫНА, ЖКМ. ЙА МАЙ, R 
ІШЕ CPU E 1 字 节 的 宁 。 虽 然 这 种 手工 的 模拟 很 乏味 , 你 可 能 想 要 跳 过 它 , 但 是 根据 我 们 的 经 验 ， 
仁 学 生 们 经 历 过 丙 速 缓存 是 如 何 工作 的 之 前 ， 他 们 是 不 能 真正 理解 的 。 
初始 时 ， 缓 存 是 空 的 【也 就 是 ， 每 个 有 效 位 都 是 0); 





表 中 的 每 一 行 都 代表 “个 高 速 缓存 行 ， 第 一 列表 明 该 行 所 属 的 组 ， 但 是 请 记 住 提供 这 个 位 只 是 
为 了 方便 ， 实 际 上 它 并 不 真是 组 存 的 一 部 分 。 后 面 四 列 代表 每 个 高 速 缓存 行 的 实际 的 位 。 现 在 ， 让 
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我 们 来 看 看 当 CPU 执行 一 系列 读 时 ， 部 发 生 了 什么 : 

1. 地 址 0 的 他 。 因 为 组 0 的 有 笋 位 是 0， 是 绥 存 不 命中 ,高 速 缓存 从 存储 器 【或 低 НАЯ 
сазына о, 并 把 这 个 块 存储 在 组 0 中 。 然后 , АТА ЕТЕН ВУ РА ЖОН) mf0] 
( 存 情 器 位 置 0 的 内 容 )。 





0 | 0 m|0] mfl] 
| 0 
2 0 
3 0 


2. 读 地 址 1 Й, ikatan. ИЕЛЕ А А ДАТ ЧН (Ч mls mR 
ЛАКА АЗУ, 

3. 读 地 址 13 Ў. HTH? hija ТАЕН, MUERE vF. ай Е 
6 加 载 到 组 2 中 ， ^s wo er T + 1113]. 





4. ЖШ 8 ELI SACER D. f 0 PARR TAR Sak, ІН С ЧЕЙС. 
名 速 缓存 将 块 4 加 载 到 组 0 中 《替换 读 地 址 0 ВРА Аут), А АО Ло НОП 
Y& [8] m[8|. 


а [аш [wes [ sn | аш _ 


| і m[8] m[9] 
( 
| ! m[12] m[13] 
( 


5. ЖАН 0 BE. LAERT B. AAAA S Hih 8 Pf. RR IRURE HR T Eo. 3X 
ла RIT T BIET. BRER АЕ А ИТЕН, fiU E SIRE RORIS] … 个 组 
ПУА. 


а mms Гаа xe | жн `! 


| 0 mr mfi] 
0 
| 1 m{12] m[13] 
Ü 


ИШАН ЕРИНИ КЁ! 
冲突 不 命中 在 真实 的 程序 中 很 常见 ， 会 导致 令 人 困惑 的 性 能 问题 。 当 程序 访问 大 小 为 2 КУЖ 









1 
2 
3 


Ü 
l 
2 
j 
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ЖЕ, АЖИ A RS ETAS SREZ Р» ИШ. AARAA IB И АННА: 
float dotprod(float x[8], float y[8B]) 
l 
float sum = 0.0; 
int 1: 
for (i = 0; i < B; 1+#-) 
sum += x[i] * yli]; 


1 
2 
3 
4 
5 
б 
- 
8 return sum; 
3 


) 

对 于 x 和 yy 来 说 ,这 个 函数 有 良好 的 局 部 性 ， 因 此 我 们 期 望 它 的 命中 率 会 比较 高 。 不 辛 的 是 ， 
并 不 总 是 如 此 。 

假设 浮 点 数 是 4 个 字 节 ,x 被 加 载 到 从 地 址 0 开始 的 所 字 节 连续 存储 器 中 , 而 了 КЮЕ x 之 后 ， 
从 地 址 32 开始 。 为 了 简便 ,假设 一 个 块 是 16 个 字 节 (足够 容纳 4 个 浮 点 数 )， 高速 缓 存 出 两 个 组 组 
成 ， 疝 速 缓存 的 整个 大 小 为 32 字 节 。 我 们 会 假设 变量 sum 实际 上 存放 在 一 个 CPU 寄存 器 中 ， 因 此 
个 需要 存 赃 器 引用 。 根 据 这 些 假设 每 个 [00 Шыда 





FETH, PARR- KERA x[0]， 缓 存 不 命中 会 导致 包含 x[0] 一 x[3] 的 块 被 加 载 到 组 0。 
F PREX y{ 介 的 引用 ， 六 一 次 缓存 不 命中 ， 导 致 包含 y[0]~y[3] 的 块 被 拷贝 到 组 0， 履 盖 前 一 次 引 
用 找 中 进来 的 x 的 值 。 在 下 一 次 办 代 中 ， 对 x{1] 的 引用 不 命中 ， 导 致 x|0] 一 x[3] 的 块 被 加 载 问 组 0, 
Жаа” ?[0] 一 y[3] 的 块 。 因 而 现在 我 们 就 有 了 一 个 冲突 不 命中 ， 而 实际 上 后 面 每 次 对 x A y 的 引用 
部 会 导致 种 突 不 傅 中 ， 我 们 就 在 x 和 у 的 块 之 间 抖动 Chas. 术语 “和 料 动 ” 搬 述 的 是 这 样 一 种 情 
їл, ЖЫТ БЕ MUT ЕНІ АРБОН АЕ. 

简要 来 说 就 是 , КЕЛЕН ӘЛІНІҢ e) BOE TERT E ЕЖ ЛЕН ДК ЕП ЖЕ xi) 
Ж IRR, АЗН ЖТ ЖА ат, IUDA EB c ТЫ] — НИН. X 
ВРЕ) Е КЕ 2 或 3 倍 并 不 稀 背 。 男 外 ,还 要 注意 虽然 我 们 的 示例 极其 简单 ,但 是 对 于 更 大 ， 
更 现实 的 直接 映射 高 速 缓存 来 说 ， 这 个 问题 也 是 很 真实 的 。 

幸运 的 是 ， 一 旦 程序 员 意 识 到 了 下 在 发 生 什 么 ， 就 很 容易 修正 抖动 问题 。 一 个 很 简单 的 方法 是 
企 每 个 数组 的 结尾 放 В FIRAR. РИШ, TER x EXA Поа x[8]， 而 是 定义 成 Пол! x]12). f& 
设 企 存储 器 中 yy RIRE х 后面 我们 有 下 面 这 样 的 从 数组 元 素 到 组 的 映射 : 





y[0] 
[1] 


v[5] 
v[5l 
I y[7] | Ms 





1 


Ех Ан ГІЗ, [1% [iB ЕЕЕ НТ ЖИН. ІНШІ opp, 


i£ IB 6.7 


在 前 面 dotprod 的 例子 中 , 在 我 们 对 数组 x AT k Е, hop kde y nz mede E E n 


Wik: 为 什 备用 中 间 的 性 来 做 案 引 ? 

келте. AAA RREAN Hikki ARANA. SHEEP GERE 
AAEH ENH. HB 631 КИТА. PERGAR инида нна 
UESAGMEA, Hi, EEP, АЛАВИ йл Ан, Жаа Ма, 
кеін, АГАНАС ЮАН, Жа АЧ Е, MAAE, жама 
ERREFE- HERXJTEKGAE, ЦИЯДАН ЦЕ, Socr Sed mies, Wq 
HRXIMAGUERM RUNS. ёк ин. MELASE С ША. 


Ж Жар Т AE. 


4 TS Ж r 





Ñt: al 





s 


a T. 


өсі к) 
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TE B | 423 


ЕШ ЕВ 
Е, bR-— hii s А О, maid Ee И Е а 
5, 
A. SEA E ki b REB ER. C chunks) ТЖЕУ МЕ? 
B. ЖАТК, ЕЕЕ t hiki 6S5 (5EBm)s(5121,3232) HAEL: 
int array [4085]; 
tor {і = 0; i < 4096; i++) 
aum += array[i]l; 


ЛЕНІ. n 4dkd4ustéRGRERXETÀ4SY! 
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ЧЕНИН ЖЕЙ Үр Р Ж Айт р НЕНИ E i pa RS EB. МЕЛПІНЖІЕЖ 
fix E= 1) АТЫЙ. SEE biti k (set associative cache) W Т АЖ ЫЫ. —— 
naeiraE£EIT-—CgWBaiuEmIT.—TIcEcCHBUERIEUO IS 3 W 3 EBTTAR ШЕН. ú 
F er, ПЖ ПЁ E= СВ ТАТҮ. НӨЗИЖІ-ТОВННЕНЖ ЕНІН. 


xa] |-и 





图 532 SdgEEESS (| << СУЯ) 
АВ Р. HIER EPt. Rk ANE- t? КИНИ kam. 


Е P 8 LER 
TJ BE РСН PEOR T TEILE FE IF, НЕЗ, Hem TETUR. 
ИШКЕ P ECC RIT ER 


НКТ КИТЕ НИ HER IE GEN PEUPLE WR. DRE fr T іа 
Ride. СТАИТЕ ТЕА, —TeSImniREBE—TRNEES. 以 地 让 作为 输入 ， 
站 退回 存 情 在 于 个 地 十 的 值 。 圾 一 方面 ， 一 个 相 联 的 存 赃 器 是 一 个 key,vajne】 对 的 数组 ， 己 key 
ЖА, 返回 与 输入 的 Key 相 匹 配 的 Ckey.valus) 对 中 的 value ІҢ. 因此， 我 们 可 以 把 组 相 联 高 速 齐 
性 中 的 每 个 组 都 看 成 一 个 小 的 组 相 联 存 赃 器 ，key Ж ШЕП, ІП value ИЕНІ. 

图 在 了 展示 了 组 相 联 高 速 田 存 中 行 苞 配 的 基本 思 相 .这 里 的 一 个 重要 因 下 就 是 组 中 的 任何 一 行 
事 可 忆 信 人 富 任 何 映 圭 到 这 个 组 的 存储 器 霹 。 所 以 商 速 缓存 必须 粮 索 组 中 的 熏 一 行 ， 寻 拷 一 个 有 效 的 
ІТ, КӨКЕ TARIE РЕ АС. ШПИНЖИНТЕН ТАаН-т, EARMA, НАН 
个 热 中 选择 一 个 字 ， 和 前 面 一 样 ， 
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标记 AR BR 
6.33 组 相 联 商 速 组 存 中 的 组 选择 


= 1701 ӘЛБЕН ЖАМ. 
& 






Selacted set (i): 


(3y ШЖ {1) 和 (2) 为 真 ， 
ЖА Ки l, БН 


(2) МЖЖ ТТТ T. a 
其 标记 位 必须 严 配 地 址 


"E BH OT. iii таралар 
th 5] b: 
m-i ü 
by ig ЯН ж51 Bus E 
图 6.34 组 相 联 高 速 缓 存 中 的 行 匹配 和 字 选 择 
янка ор НУТ. 
如 果 CPU 请 求 的 字 不 在 给 的 任何 一 行 中 , 那么 就 是 不 命中 ， 高 速 缓存 必须 从 存储 器 中 取出 包 合 


这 个 于 的 块 。 不 过 ， 一 旦 丙 速 缓存 取出 了 这 个 块 ， 沪 替换 哪个 行 电 ?当然 ， 如 果 有 一 个 空 行 ， 扼 它 
xU T BEEN EE. 但 是 如 果 访 组 中 没有 空 行 ， 那 么 我 们 必须 从 中 选择 一 个, 希望 CPU 不 会 很 快 引 
用 这 个 被 蔡 换 的 行 。 

程序 员 很 难 在 他 们 代 公 中 利用 高 速 缓存 替换 策略 ， 所 以 在 此 我 们 不 会 过 多 邮 讲 述 其 细节 。 最 简单 
的 登 换 策略 是 随机 网 择 竖 替换 的 行 。 其 他 更 复杂 的 策略 利用 了 局 部 性 原型 ， 以 使 在 比较 近 的 将 来 引用 
航 登 换 的 行 的 概率 最 小 。 例 如 ， 最 不 常 使 用 〔【]least-frequently-used，LFU) 策略 会 替换 在 过 去 某 个 时 间 
窗 门 内 引用 次 数 最 少 的 那 ~- 行 。 最 近 最 少 使 用 (jeast-recently-used，LRU》 ЖБМ ЫН -- 次 访问 
时 间 报 久远 的 于 一 行 。 所 有 这 些 策 略 痢 需要 烙 外 的 时 间 和 人 硬件。 但是， 越 往 存 储 器 层次 结构 КІШ, 
远离 CPU， 一 次 不 命中 的 开销 就 会 更 加 早 趴 ， 用 更 好 的 普 换 策略 使 得 不 命中 最少 也 变 得 更 加 值得 了 ， 


644 ”全 相 联 高 速 组 存 


一 个 全 相 联 高 速 缓存 〈 和 lly associative cache) 是 由 一 个 包 合 所 有 高速 缓存 行 的 组 (也 就 是 , E= 
C/B) 组 成 的 。 图 6.35 给 出 了 基本 结构 。 
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全 相 联 高 速 缓存 中 的 组 选择 

件 相 联 高 速 丑 存 中 的 组 选择 非常 区 单 ， 因 为 只 有 一 个 组 , 图 不 站 做 了 个 小 结 , ПЕВА ЕН 
ido, mana Т Л ЧИА. 
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EDS mE НАР ТАН ЖТ УНП АЕ а, Ва КУКЕ Rr Ж ci A 
Ж, H RGB, АЩ. “ШНЕК e {Ийт ШР НЕР, VIE Urs КИСТ ИТЕ 
用 缓冲 器 (TLB)， 它 缓存 页 表 硕 《10.6.2 37), 

%®5)Ж 6.9 

下 面 的 问题 能 帮助 你 加 强 理解 高 速 缓存 是 如 何 工 作 的 。 有 如 下 假设 ; 

e。 在 储 器 是 宇 节 好 址 的 。 

€ 存储 器 访问 的 是 | 字 节 宽 的 字 (不 是 4 字 节 宽 的 字 》 

e 地址 的 宽度 为 13 位 ， 

. 高速 继 存 是 2 路 组 相 联 的 【 呈 = 2 了)， 块 大 小 为 4 守节 (B=4) 有 8 个 组 (5=8), 

高 速 组 在 的 内 容 如 下 ， 所 有 的 数字 都 是 以 十 六 进 制 来 表示 的 : 


2 ИННИ + 


一 T 
AR | 标记 位 ”有 有效 位 Two FAL Tel 字 节 3 | 标记 你 Aau 字 节 0 字 节 1 守节 2 SG 
(9 ] 50 30 3F 10 — 





Ü) — 
] : | 
7 - - - - 
3 
4 
қ - 
ü - 
7 / j 


下 面 的 方 框 展示 的 是 地 址 格式 【每 个 小 方 框 一 个 位 六 指出 (在 图 中 标 出 ) 用 来 确定 下 列 内 容 的 
T: 


CO ñit AER 53$ 
СІ ЖЖК: 
CT 高 速 提存 标记 


i$.5] 6.10 


TR — 32 PF43541 4 69 中 的 机 器 上 , 它 引 用 地 址 0x0E34 处 的 1 学 节 宇 。 指 出 访问 的 高 速 绥 
并 项 贞 和 十 六 遂 制 表示 的 返回 的 沿 还 疆 存 字 节 值 。 指 出 是 否 会 发 生 缓存 不 命中 ， 如 果 会 出 现 缓存 不 
命中 ， 用 "-” 打 表示 “返回 的 高 速 疆 存 字 节 ”， 

А. 地 址 格式 【每 个 小 方 框 一 个 位 】; 
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时 于 里 习题 掉 9 中 的 高 速 屿 站 ， 列 出 所 有 的 在 蛆 Фе РИ + НАШИ. 
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645 ”有关 与 的 问题 

正如 我 们 看 到 的 ,高 速 组 存 关 于 读 的 操作 非常 简单 。 首先, CRER TERNET w ИО UL. 
mE. ЭЕ [АУ wé CPU, ^29. ЖАРНАНЫ S f w ВЈ, ЖАЛБЫ A E 
A ЕРЕ (rir Со 86208636 — TART ЖАЯ w ЕГИ CPU. 

写 的 情况 就 要 复业 一 些 了 。 假设 CPU S :个 已 经 缓存 了 的 字 W L9 Y. (write hit)], (EE 
缓存 更 新 了 它 的 w HAIZE. BAEN w 在 存储 器 中 的 拷贝 呢 ? 最 简单 的 方法 ， 称 为 直 写 
(wriite-through)， 就 基 立 即将 w 的 章 速 缓存 块 写 园 到 存储 器 中 。 虽 然 简单 ， 但 是 址 写 的 缺点 是 每 条 
存储 指令 孝 会 引起 总 线 上 的 一 个 号 事务 。 另 一 种 方法 ， 称 为 写 国 【write-back])， 尽 可 能 地 推迟 存 情 
器 更 新 ， 凡 有 当 蔡 换算 法 要 了 豫 逐 已 更 新 的 块 时 ， 才 把 它 写 到 存 赃 器 。 由 于 局 部 性 ， 写 回 能 显 闭 地 减 
少 总 线 事务 的 数量 ， 但 是 它 的 缺点 是 增加 了 复 隶 性。 局 速 缓存 必须 为 每 个 向 速 缀 存 行 维护 个 额外 
的 修改 位 (dirty bib, ЖТА TEER. 

为 一 个 问题 是 如 何 处 理 写 不 命中 。~- 种 方法 ， 称 为 写 分 配 Ownite-allocate), ДП НУН TE Ma 
块 到 局 速 缓存 巾 ， 然 后 更 新 这 个 商 速 缓存 刀 。 写 分 本 试图 利用 号 的 空 旧 局 部 性 ， 但 是 缺点 是 每 次 不 
草 中 部 会 导致 一 个 块 从 存储 器 传送 到 高速 缓存 。 另 ”种 方法 ， 称 为 非 写 分 配 (not-write-allocate )， 
避 开 癌 束 缓存， 直接 把 这 个 学 写 到 存储 器 中 。 直 写 高 速 缓存 通常 是 非 写 分 配 的 。 写 回 疝 速 缓存 通常 
是 写作 请 的 。 

为 妃 操 作 优化 癌 速 缓存 是 “个 细致 而 腹 难 的 门 题 ， 在 此 我 们 只 略 讲 颇 毛 。 细 节 随 系统 的 不 同 而 
不 同 , 而 日 通 第 是 私有 的 ， 交 档 记 水 不 详细 。 对 于 试图 编 瑟 融 速 绿 存 比较 友好 的 程序 的 程序 员 玉 说 ， 
34118 M Hi ЖН - :个 使 用 写 叫 和 写 分 配 的 高 速 缓存 的 模型 ， 这 样 建 议 有 上 儿 个 原因 。 

通 前 ， 册 于 较 长 的 传送 时 间 ， 在 储 器 层次 关 构 巾 较 低 苦 的 缓存 更 可 能 使 用 当 回 ， 而 不 是 直 写 ， 
葬 如 ， 虚 拟 芷 储 器 系统 “用 主 存 作 为 存储 在 磁盘 上 的 庚 的 缓存 ) HER Sl, HER FB ЬЕ 
卉 的 提 凯 ， 写 回 的 高 复杂 性 也 越 来 越 木 成 为 阻碍 了 ， 我 们 在 现代 系统 的 所 有 层次 上 都 能 看 到 写 回 高 
速 缓 仔 。 所 以 这 种 假设 符合 当前 的 趋势 。 假 设 使 用 写 回 写 分 配方 法 的 另 -个 原因 是 ， 它 与 处 理 读 的 
方式 祖 对 称 ， 因 为 妆 问 号 分 配 试 图 利用 局 部 性 。 因 此 ， 我 们 可 以 在 高 层次 上 开发 我 们 的 程序 ， 展 孙 
展 好 的 空间 和 时 间 局 部 性 ， 而 不 是 试图 为 某 一 个 存储 器 系统 进行 优化 。 

646 指令 高 速 组 存 和 统一 的 高 速 缓存 

到 日 前 为 小 ， 我 们 7 RB IRE ЕА Е, CIEL, Зр Е. BEATAE GR. 
也 保存 指令 。 只 保存 指令 的 商 速 缓存 称 为 eache。 只 保存 得 序数 据 的 高 速 缓存 称 为 d-cache, FLIR 
HB? X BLTESCIE II RU SEHR SR EAA Cunified eache)， 一 个 典型 的 桌面 系统 CPU 45H 
本 本 就 包括 一 个 LIi-cache 和 «LI d-cache, [6.38 总 结 了 基本 的 结构 。 

GPU 


L1 d-cache 


图 6.58 ”一 个 典型 的 第 层 高 速 缓存 结构 
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Hmmm. AMF Alpha 21164 FJ Ж. HELI AL ТАТЕ CPU ЖК E, Ж 
fi — Tr Bm {ЕДЕ ES L ШЕЙ Т Ар T MERE Ж {КАЯ НЕ ШІНІҢ ЕЙ i-casche 
M] ӛссе, BT Min ТОЙ. ЕЕЕЕНАЫ-ЗМНИМЯТИЕ- 32 8 — WAR. 
ӨМГ, 没有 系统 使 用 了 тА НЫ ІЛ, ЕКЕНЕНЦИЕКМЯМЕЛДІРНІЖІ, ші 

不 志 可 能 出 再 这 样 的 情况 。 






EE E LI ск 
ЕҢ RALI d-csch 
| жё&н LHhil& ЕТІП, 






8.39 Intel Pentium Ki r shi 


647 MARTERA EEE 
fivc dba e E E RE. 
. 9 Ж (miss Tala)i， 在 一 个 程序 执行 或 程序 的 一 部 分 执行 嚼 间 ， 存 储 器 引用 不 十 中 的 比 
窜 ， 它 是 这 样 计算 的 ， 不 请 中 是 量 六 | 用 数量 ， 
. Gri (hire). ФЕНТЕЗИ, E 





a 命中 时 间 Chit üme). MAENT tF CPU PIE, mede. Cadm 
АЖЕН. HFL ARSTER. APAE 1-2 мВ, 
. ФР АТ] (miss penalty)， 由 于 不 命中 所 需要 的 窗外 的 时 间 . LI 不 谷中 雷 要 从 1L2 得 到 服 
THAT. ARE 5-10 ЖШ. Li 不 傅 中 雷 要 从 主 存 得 到 服务 的 和 处罚 ， 典 型 是 24—100 
个 周期 ， 
优化 高 速 壮 存 的 成 本 和 性 蓝 的 折 中 是 一 项 视 辅 户 的 工作 ， 它 需要 薄 现 实 的 基 天 程序 代码 上 壕 行 
太 量 的 入 所， 因此 起 出 了 我 们 讨论 的 范围 。 帮 过， 还是 可 己 让 识 一 些 定性 的 折 中 ， 


Жн ҚАНЕ 

“ЖШ, КАЖ ИГЕ е 9, A ORC AERE EO EGRE 
БИН. БЖ, W KN Rae ig I RT RES pH, METER BG LI GRIS Ж 
E. RATA dtr iur [8] 540 239 — ВЕЕ Д. 

B piti ы 

ARRARRAY. — т Тао, ӨКЕН ЕТЕНЕ ІН, ИШЕТ Ж, 
Ti РАР Р Koh. АШ qeu ma Nb. кетінміндіти НЕЕ] 
WRITES EHE PER PI er Ж. ЮЕШ А Ат ТОНЫ d ien, БЫЛ, Hus 
Ж. ЖИЕНИ EP. ТЖ НАНА 4-8 TT. 
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TELE W ЗУ Sa 

这 里 的 问题 是 参数 上 【每 个 组 中 高 速 缓存 行 数 》 МЕНЕЕ. НЕЕ OERE ЕНИН 
较 大 ) 的 优点 是 降低 了 疝 速 缓存 由 于 冲突 不 命中 出 现 拌 动 的 可 能 性 。 不 过 ， 较 高 的 相 联 度 会 造成 较 
向 的 成 本 。 较 高 的 相 联 度 实现 起 来 很 昂贵 ， 而 忆 很 难 使 之 速度 变 快 。 每 一 行 需要 更 多 的 标记 位 ， 每 
— h EMA BJ LRU 状态 位 和 额外 的 控制 思 辑 , 较 高 的 相 联 度 会 增加 命中 时 间 , 内 为 复杂 性 增加 了 
Rie TER ЛХ Р, AAAH (victim line》 的 复杂 性 也 增加 了 ，。 

相 联 度 的 选择 最 终 变 成 了 命中 时 间 和 不 命中 处 罚 之 间 的 折 中 。 传 统 上 ， 努 力争 取 时 钟 频率 的 疝 
性 能 系统 会 选择 直接 映射 L1 高 速 缓存 〈 这 里 的 不 命中 处 罚 具 是 几 个 周期 )， 而 在 匀 低 屋 上 使 用 化 较 
小 的 相 联 度 〈 比 如 说 2 一 47， 但 是 没有 固定 的 规则 ，Intel Pentium RAP, LIA L2 局 速 缓 存 是 4 
路 组 相 联 的 。Alpha 21164 系统 中 ，L1 指令 和 数据 高 速 缓存 是 直接 映射 间 ，L2 BERTE З ЕНІН 
ЖАУ, if] L3 EET АКЕЛ. 


ЕЧ IJ RM 

ЕҢЕЖИНЕРЕНЕН, T R @# H ЛА (write buffe), tor БЕНЕН. MXE 
ЖАН ШЖ, ja РНИ ХА K, ИЯЛ ЕЕ ES. B-D. НЕН ЕН 
引起 的 传送 比较 少 ， 它 允许 更 多 的 到 存储 器 的 带宽 用 于 执行 DMa 的 UO AS. КО, ЖӨН KZ 
下 和 耐 杰 ， 传 送 时 间 增 如 ， 减 少 传 送 的 数量 就 变 得 更 加 重要 。 BME. MERTE F. Mi HE 
ЖАРТАЕВ. 


Өл. КӨНЕ. ЕН ТАЯ? 

ЖЕЗАЯ%ЗН Ақ. ВЕК. EARE- TREERE, ЖЖЖИ: 

4 АЖ-ТНААТЫА6, ERRAR (АТ-АфаАЯА) 2 kudis, 

e 行 是 高 速 组 存 中 三 刍 块 以 及 其 他 舍利 (Изел ЖАРАН) Ю.б. 

€ fat — ES MPERO. pH dob ota TO. oio emm dob v 

的 组 是 出 名 个 行 组 戌 的 ， 

在 直接 照射 高 束 色 在 中 ， 纽 和 行 确实 是 等 价 的 不过， 在 相 联 高 速 独 存 中 ， 组 和 行 是 很 不 一 样 的 ， 
这 两 个 词 未 能 直接 使 用 ， 

因为 一 行 总 是 在 储 一 个 志 ， 求 语 “ 行 ”和 “ 决 ” 通 常 互 撞 使 有 用。 例如， 系统 专家 总 是 说 高 迷 狂 存 的 
“ 行 大 小 ”， 笑 际 上 他 人们 拱 得 是 块 大 小 ， 这 样 的 用 法 寸 分 普遍， 只 要 你 理 靛 块 和 行 之 闲 的 区 别 ， 它 不 会 
道成 任何 误会 ， 


65 ”编写 高速 缓存 友好 的 代码 


{ 62 1 中 ， 我 们 介绍 了 局 部 性 的 思想 ， 而 有 全 大 概 地 谈 了 一 下 什么 会 兵 有 芭 好 的 局 部 性 。 姨 执 
我 们 已 经 明白 了 痪 速 缓存 存储 器 是 如 何 工作 的 了 ， 我 们 就 能 更 如 精确 一 些 了 。 局 部 性 比较 好 的 程序 
喝 容 易 有 较 低 的 不 命中 率 ， 醒 不 命中 率 较 低 的 程序 倾 网 于 比 不 命中 率 较 高 的 程序 运行 得 更 快 。 因此 ， 
从 县 有 民 好 局 部 性 的 意义 上 来 说 ， 好 的 程序 员 总 是 应 读 试 着 去 编写 高 速 轨 在 友好 (cache friendly) 
的 代码 。 上 直面 三 是 我 们 用 来 确保 我 们 的 代码 高 速 缓 存 友 好 的 基本 方法 : 

l 让 最 常见 的 情况 运行 得 快 。 程序 通常 把 大 部 分 时 间 部 花 在 少量 的 核心 函数 上 ， 而 这 些 函 数 遂 
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m OK My ТА ИЕТ ] b REE. ИЕА ЕНН АЫ Е, misa 
分 。 

2 在 每 个 和 狂 环 内 部 使 狂 存 不 命中 数量 最 小 ,在 其 他 条 件 , 例如 加 载 和 存储 的 总 次 数 ， 相 同 的 情 
Л.Е, ӨЗЕННЕН ИЛЕН. 

为 了 看 看 实际 上 这 是 怎么 工作 的 ， 考 虑 6.2 节 中 的 函数 sumvec: 


int sumvecíint v[N]) 
| 


int i, sum = 0; 


1 
2 
4 
4 
5 for (1 = Ü: i < N; i++} 
Б sum += ү[1]; 

q return sum: 

B 


] 

ХАЖ AERE ACH»? 首先 ， 注意 对 于 局 部 变量 i 和 sum， 特 环 体 有 良好 的 时 间 局 部 性 ， 
买 由 芋 ， 因 为 它们 都 是 局 部 变量 ， 性 体 合 理 的 优化 编译 器 都 会 把 它们 组 存在 寄存 器 文件 中 ， 亿 就 是 
存 情 器 层次 结构 的 最 蜗 屋 中 。 现 在 考 碟 一 下 对 向 量 v 的 步 长 为 1 萄 引用 。 一 般 而 言 ， 如 果 一 个 高 速 
fii K h B 字 节 ， 那 么 一 个 步 长 为 上 的 引用 模式 《这 里 k 是 以 学 为 单位 的 ) 平均 每 次 循环 碗 
代 会 有 min(1，(wordsize XkYB) 次 缓存 不 命中 。 当 k=1 时 ， 它 取 最 小 值 ， 所 以 对 v 的 步 长 为 1 的 引 
用 确实 是 高 速 缓 存 友 好 的 。 例如， 假设 是 块 对 齐 的 ， 字 为 4 个 字 节 ， 高速 缓 存 扇 为 4 个 字 ， 而 高 
ЖЕТИЛ АР (W ЖЕН). 然后 ,无 论 是 慎 么 样 的 高 速 绿 存 结构 ， 对 » 的 引用 都 会 得 到 上 面 的 
命中 和 不 命中 模式 ， 


EE Ta e e И 


GK Bl PR. v[0] 的 引用 会 不 命中 ， 而 相应 的 包含 v[0]— v[3]8J Ж VF 838 RS 
REAP. 因此， 接 下 来 三 个 引用 都 会 命中 ， 对 vy[41 的 引用 会 导致 不 命中 ， 而 一 个 新 的 块 被 加 载 到 
MRRP.: È 下 来 的 三 个 引用 都 命中 ， 依 此 类 推 。 一 般 而 言 ， 四 个 引用 中 的 三 个 会 命中 ， 在 这 种 
冷 缀 存 的 情况 下 ， 这 是 我 们 所 能 做 到 的 最 好 的 情况 了 . 

总 之 ， 我 们 简单 的 sumvec 示例 说 明了 两 个 关于 编写 高 速 缓存 友好 的 代码 的 重要 问题 ， 

. 对 局 部 变量 的 反复 引用 是 好 的 , 因为 编译 器 能 够 将 它们 缓存 在 寄存 器 文件 中 5 时间 局 部 性 )。 

* 沙发 为 1 的 引用 模式 是 好 的 ， 因 为 存 娃 器 层次 结构 中 所 有 层次 上 的 缓存 都 是 将 数据 存储 为 

连续 的 扎 《 空 间 局 部 性 )。 

在 对 多 维 数组 进行 操作 的 程序 中 ， 空 间 局 部 性 尤其 重要 。 例 如 ， 考 瞄 62 节 中 的 sumarrayrows 
图 数 ， 它 按照 行 优先 顺序 对 一 个 二 匆 教 组 的 元 素 求 和 ， 


1 int sumarrayrows(lnt a[M][N)) 


{ 

















^\ 
3 int 1, J), sum = Ü; 
4 
5 


for (i = 0: 1 < M; i++| 


432 $*6* 


for [j = 0; j < N; j++) 
Sum += а[11[351; 
return вип; 


wD o) ~] mm 


) 


HT CUTDEB E ER. AUTAR ERRA  sumvec 一 样 好 的 步 长 为 1 的 访问 
So. BI. BERIDA ИЛЕН Go sumvec. РЕКИ. 那么 对 数组 а В ЯГ 
的 命中 和 不 命中 模式 ， 





TE ЖЕШ ЖЭПЕ ~ 个 看 似 无 伤 大 雅 的 改变 一 一 泥 换 循环 的 次 序 ， 看 看 会 发 生 什 么 : 


int sumarraycolsiint a[HM1]18)) 
{ 


int i, j, sum = Ü; 


1 
2 
j 
4 
2 for (j = 0; j < N; j++; 

É for {1 = 0; 1 < M; i++} 
1 sum += a[il[j]; 

8 

3 


reLturn sum; 


š } 

кнн. REIA д т ТАНАН КЕН 8]. REESE, STE 
а, ЛА, ВИО АН ЕЈ Р Е 14， 不 过 ， 如 果 数 组 比 高 速 缓 存 要 大 【更 可 能 出 
现 这 种 情况 》， 滥 么 每 次 对 afil[j 的 访问 都 会 不 命中 ! 





入 向 的 命中 率 对 运行 时 间 可 以 有 显著 的 影响 。 例 如 ， 在 我 们 的 桌面 机 器 上 ，sumarraycols 每 次 
ЖАҚ RR TIAE 20 个 时 钟 周 期 ， 而 sumarrayrows АЕ ЕНЕРІ 10 个 周期 。 总 之 ， 程 序 
员 应 工 注 意 他 们 程序 中 的 局 部 性 ， 试 着 编写 利用 局 部 性 的 程序 。 


ЗИ 6.14 
在 入 号 处 理 和 科学 计算 的 应 用 中 ， 转 置 炬 阵 的 行 和 列 是 一 个 很 重要 的 问题 。 从 局 部 性 的 角度 来 
看 ， 它 也 很 有 趣 ， 因 为 它 的 引用 模式 既是 以 行为 主 (row-wise)】 的 ， 也 是 以 列 为 主 (column-wise ) 
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4. 9, + É КЕЕ ЖА. 


typedef int array|2][2]; 


1 

2 

3 void transposeliarray dst, array src) 
à [ 

5 int 1, 1; 

б 

7 For {i = 0; i < 2; i++} Í 

B for (1-0; J < 2; 1++} { 

9 dst[il[i] = srcli][i3l: 


BHE- 6 BORSE ДН 0 PUS КЕНЕН ҚАҢ, 

є  sizeofünt) = 4. 

* src 数组 从 地 址 站 开始，dst 数 组 从 地 址 16 7E 36. ( + ESL), 

. 只 有 一 个 Li 数据 锅 速 缓存， 它 是 直接 映射 的 ， 直 写 、 写 分 配 ， 块 大 小 为 虽 个 守节， 

e 这 个 高 速 缓存 总 的 大 小 为 16 个 数据 字 节 ， 一 开始 是 空 的 。 

е ST src 和 由 数组 的 访问 分 别 是 读 和 写 不 命中 的 疏 一 原因 . 

А. 对 得 个 row 和 eol， 指明 对 sre[row][col] f» 必 tfrowj[eell 的 访问 是 命中 (h) 还 是 不 命中 【im ). 
例如 ， 读 sre[0j[0] 会 不 命中 ， 写 dst[0][0] 也 不 命中 ， 





B. 对 于 一 个 大 小 为 32 数据 字 节 的 高 速 急 存 重 复 这 个 练习 题 . 


练习 题 6.15 

Eit — 4-180822 89293, SimAquarium Ы А-А (tight loop), CHE 256 个 海 
* (algae) 的 平均 位 置 。 在 一 台 具 有 块 大 小 为 16 9 (В=16). ЖМА 1024 字 节 的 直接 映射 
数据 乌 存 的 机 器 上 测量 它 的 高 速 姓 存 性 能 。 定 义 如 下 ; 

1 atruct algae position { 

2 int x; 

int у; 
l; 


struct algae position аг1а[16][16]; 
int total x = 0, total y = Q; 
int 1, Jj: 


HA de ERG: 


сб << kn A um n 
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+ Sizeofiint) = 4. 

• grid АЛМАНЫ 0 开始 ， 

e ЁЛЕ ЛЛУ Аты, 

. ф—&0 ERI ЖАДИ grid їл, Р]. Ж ЖІ. j. total x 和 total, y 43x46 428 
T. 

确定 下 面 代码 的 商 速 组 存 性 能 ， 

for {і = Ü; 1 < 15; i++) 4 

for (j = 0; j < 16; j++) Í 
total x += grid[i][j].x:; 


1 

2 

3 

4 

5 ) 
b 

1 for {1 = 0; 1 є l6; i++} f 

ü Far ij = 0; J) < 16; j++} Í 

9 total y += аг18(11111.у; 


10 } 

11] 

A. GRASSES) 0 0 oO 

B. DAAT FHE RES — 
C. T4 Тт ЖЖ $ V 9 


练习 题 6.16 | 
给 定 练习 题 615 的 假设 ， 确 定 下 列 代码 的 高 速 缓存 性 能 : 
1 for (i = 0; 1 < lé; l++) [ 

2 tor (j = 0; j « 16; j++) Í 

3 total x += grid[j][il].x: 

4 total y += grid[)][il,y; 
5 

© 


) 


А. 读 总 数 是 多 少 ? 

В. Sik AG Жр мр НЯЎ? 

C. 不 命中 率 是 多 J? O 0 5 1, 

D， 如 有 高 速 缓存 有 两 倍 大 ， 那 么 不 命中 率 会 是 多 少 呢 ? 


练习 类 6.17 

БЕЛАЯ 6.15 的 假设 ， 确 定 下 列 代码 的 高 速 缓 存 性 能 ， 
1 for (i = Ü; i « l6; 14-84 

2 [for ¿jJ = 0: 1 < l6; J++) Í 

3 total x += дк14[1][1].х; 

1 tota: y += gridlil[il.v; 

5 


6.6 


的 讨论 ， 


ы СЗ uU og c 
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ЖЕЖ $77 

.高速 组 在 不 命中 的 读 总 数 是 多 少 ? 

. Arpa $O) . 

SUE ЖЛЕ НАҚ, МАЖ ФЖ2Д $ y eg? 


бта: PPR FX 32 PF ЕНЕН Ж I 
本 节 通 过 研究 遍 束 组 存 对 运行 企 实际 机 器 上 的 程序 的 性 能 影响 ， 综 合 了 我 们 对 存 悄 器 层次 结构 


6.6.1 存储 器 出 (memory mountain) 

一 个 程序 从 存储 系统 中 读数 据 的 速率 被 称 为 读 知 吐 率 read throughput)， 或 者 有 时 称 为 读 带 宽 
(read bandwidth). WR TRARRE s 秘 的 时 间 段 内 读 n LEGS. 3BAOXERM BISHER XA 
T ms， 典型 地 是 以 焰 字 节 每 秘 (MBA) 为 单位 的 。 

ЖР CET EATR RIA (tight program loop) 中 发 出 ”系列 该 请 求 ， 
那么 测量 出 为 读 否 吐 率 能 计 我 们 看 到 对 于 这 个 读 序 列 来 说 的 存储 系统 的 性 能 。 图 640 给 出 了 对 测 


i P Ve FE ЖЕН Ж. 
code/mem/mountaimn/mountain.c 
1 void test(int elems, int stride) /* The test function */ 
2 | 
j int 1, resul- = 0; 
É volatile int sink; 
5 
6 for {1 = 0; 1 < elems; i += stride) 
7 result += data[il; 
Ü sink = result; /*Socompiler doesn't optimize away the loop */ 
9 | 
19 
11  /*Runtest(elers, stride) and return read throughput (МВ) */ 
12 double run(int size, int stride, double Mhz] 
13 | 
14 double cycles; 
15 in elems = size / sizeofiint]; 
16 
17 testielems, stride); /* warm up the cache */ 
18 cycles = fcyc2(test, elems, stride, 0);  /*calltest(elems,smde) */ 
19 return (size / strice] / (cycles / Mhz); /* convert cycles to MB/s */ 
eJ 





code/mem/mountam/motrntain.c 
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test ОЛАР stride 打 描 整数 数组 的 水 elems 个 元 素来 产生 读 序 列 。ran 函数 是 -个 包装 
A Cwrapper)， 它 调用 ей, БШШШ КЕ Н Ж. Ж18{т р feyc2 АШ СҰ osi 
XO 估计 了 test 函数 的 运行 时 间 ,， 以 CPU 周期 为 单位 , 使 用 的 是 第 9 章 中 讲述 的 式 次 最 优 ( K-best) 
ШЕЛ. ЖЕ, run 国 数 的 参数 size 是 以 字 节 为 单位 的 ， 而 test RIOTS 83$ elems Æ TA F 
位 的 。 另 外 ， 注 意 第 19 行将 МВ 计算 为 10 字 节 / 秒 ， 而 不 是 2” 字 节 / 种 ， 

run 国教 的 参数 size ЖІ stride 允许 我 们 控制 产生 出 的 读 序 列 的 局 部 性 程度 。size 的 值 越 小 ， 得 
到 的 工作 集 越 小 ， 因 此 对 间 局 部 性 趣 好 stride 的 值 越 小 ,得 到 的 空间 局 部 性 越 好 。 如 果 我 们 及 复 
以 不 同 的 size 和 stride 值 调用 run 函数 ， 才 人 么 我 们 职能 柳 盖 读 带 宽 的 一 个 时 间 和 空间 局 部 性 的 二 
ЕЕ, ER RE S l (memory mountain). É] 641 展示 了 - T E mountain 的 程序 ， 它 生成 存 
fi agi. 


code/mem/mountain/mountain.c 


| #include «stdio.h» 

2 #include "Ёсус2.һ" /* K-best measurement timing routines */ 

3 #include "clocx.h" /* routines to access the cycle counter */ 

4 

5 define MINBYTES 11 << 10) /* Working set size ranges from 1 KB */ 

Š #define MAXBYTES {1 << 23) /*., upto8 MB */ 

7 Hidefine MAXSTRIDE 16 /* Strides range from 1 to 16 */ 

8 *tdefine MAXELEMS MAXBYTES  /sizeofiint) 

9 

10 int data[MAXELEMS ; /* The array we'll be traversing */ 

11 

12 int maini} 

13 { 

14 int size; /* Working set size (in bytes) */ 

15 int stride; і* Stride (in array elements) */ 

16 double Mhz; ж Clock frequency */ 

1? 

18 init dataidata, MAXELEMS); /* Initialize each element in data to 1 */ 
19 Mhz = mhz(0); /* Estimate the clock frequency */ 
20 tor (size = MAXBYTES; size >= MINBYTES; size »»- 1) | 
21 tor {stride = 1; stride <= MAXSTRIDE; stride++) 
22 printf('$.1fXt", runísize, stride, Mhz)); 

23 

24 printfí("in"j:; 

Ar | 

26 ехіг(0); 

21) 





code/mem/mountain/mnuntain.c 


6.41 mountain: 一 个 生成 存储 器 山 的 程序 
mountain 程序 以 不 同 的 工作 集 大 小 和 步 长 证 用 run 随 数 。 工 作 集 大小 从 1KB 开始 ,每 次 增加 一 
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B. RANA SME. БЕ ЖШ 1-16. 3ETSET CERI dob ШШ fr. mountain £T ED HL ERE 
Wc. 4% МВ. Жізітіз mhz йй CHER Ru. 是 一 个 合同 FREE. UHR 
ТӘНИ Ж, (iit CPU NPR R, 

MEn AALA ME fr RU. Е ТТ ІН 6.42 Wë 
不 二 一 个 Intel Pentium IIl Xeon feri s ilr. 


550 мн, 
l KB dH: E [IF L I d-cache 
ш: ымы l KB Ж r ERLI icxhe 


12d -—— | usa s Fertium Ill Xeon 
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8 542 存储 器 山 

ТАРЕ Xeon 山 的 地 形 地 涩 展现 了 一 沾 祖 丰 寅 的 峙 析 ， ЕЕРЕЕ А АЈА фа, Н 
点 于 工作 集 完全 在 LI НЕГ 12 高 束 继 存 和 主 存 内 的 时 间 局 部 性 区 域 , 注意 ,LI dT E с 
i CPU ЖА ТОВА) ЕЛШІ RATE. (НЕ CPU i e A BOMB) 之 间 的 车 别 有 一 个 数量 
s. 

LI 山 背 有 丙 点 特性 应 访 指 出 来 。 BE. Е БЧ, ТЕЙ ЕН ЖЕН T Hp 
А 16KB PERI IKE ЖЖ ЕКЕ б САРРА ЕЕ). XC. 于 十 工作 集 友 小 I6KB. LI ia 
的 峰 顶 随 着 步 长 的 增加 而 降低 ， 因 为 工 | ИЗҮ АЕ TIEN. ЕТШ ДЕБ РЕ ЖЕБЕ Li 高 
BOM EOS a HERE. ELWA test LEE e UE IJI LL ME L MEE. 
ТЕШ ЖИ. АЕННАН чаак ЖЕНЕ ЕНЕ. 

ЛЗ ЕНІН ШИЖ ЕП. H—T Em PME. ШЖ ШЕ. L2 ЕШШ 
MAE. НЫН L2 ЖЖ FERRE VHS EH BERE Pia hiki k. HERE 即使 是 
АТКА, ЖЕРІП 或 12 高 速 缓存 时 ， 主 存 山 疹 的 最 嘉吉 也 | THEE és ЖІ. [H 
НЕ, Ш{ ЕЛЕЕ НДЕН IE HE, Sen e ВАШКЕ. EH E34ESIEERO 
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ШЫП АН PRE CRR ВРЕ, WA 643, КИПИНИННЖЕНАЕ ЗІН 
HERAUS [ЇН] ТЕА НЕНЕН ЖЩ f. SET Ko AUS 16KB 并 包括 16KB, ТӨБЕ E BEDE 
Ж L.) d-cache Т, ЕЕ, (ЕН Ж {Н | GB/s 处 ， 读 都 是 由 Ll 来 服务 的 。 


1200 1-- --- 


主 存储 区 域 ЕНЕҢ LI W 38 [x Ы 
1000 
- BQ | i 
: | 
B| 
H 500 
: ШИШИ | 
Ж 100 
x иШ! ||. | || 
| ТЇШЇ ІШІ T PHI Ш 
š Š š i Š © 
TERKA (FH) 


图 6.43 Fia ШЕН) ЕРТЕН ШЭ 
这 幅 图 展示 了 图 6.42 中 stide=1 时 的 一 个 片段 ， 


村 于 大 小 最 大 为 256KB 并 包括 256KB， 工 作 集 完全 能 放 进 L2 统一 向 速 缓存 中 。 冉 大 的 工作 集 
ЕНЕ ЖН Г. 25КЕ-512КЕ Z ARREK TRE., EA L2 Waka p. E. 512KB, 
我 们 可 能 会 预测 上 下降 出 现在 512KB 处 ， 而 不 是 256KB 处 。 要 确认 的 惟一 方法 就 是 进行 一 次 详细 的 
АТЫ. ОТЕ Ia АЕ T Pentium ІЯІОЦЗНЖЕ-М-МЕНЖЯ., EE 
ІНЕ. ЮП ПНЕ ЕВ ЖД L2 中 指令 和 数据 之 间 的 冲突 不 命中 的 结果 ， 它 使 得 不 能 将 
整个 数组 前 放 到 L2 高 速 缓存 中 。 

以 相反 的 方向 横 切 这 座 山 ， 保 持 工作 集 天 小 不 变 ， 我 们 从 中 能 看 到 空间 局 部 性 对 读 吞 吐 率 的 凡 
п]. 例如 ， 图 6.44 展 水 了 上 作 集 大 小 固定 为 256KB 时 的 片段 . 这 个 片段 是 沿 着 图 642 中 的 L2 (1138 
切 的 ， 这 里 ， 工 作 集 完 全 能 够 放 到 2 БЕ, PEN L 高 速 缓存 来 说 太 大 了 。 

КЕНЕЛДІ 个 字 增 长 到 8 个 字 ， 读 吞吐 率 是 如 何平 稳 地 下 降 的 。 在 山 的 这 个 区 域 中 ，L1 
пө ЛЕН ARMA L2 传送 到 LL RATHEE, GEEL 中 这 个 块 上 会 有 :定数 量 的 
命中 。 随 者 步 长 的 增加 ，L1 不 命中 与 L1 命中 的 比值 也 增加 了 。 国 为 不 命中 服务 起 来 要 比 命中 惕 一 
忆 ， 所 以 读 否 叶 率 也 下 降 了 。 一 旦 步 长 达到 了 8 个 字 ， 在 这 个 系统 上 8 个 学 就 等 于 块 的 大 小 了 ， 每 
TERKEL 中 都 会 不 命中 ,必须 从 L2 服务 。 因 此 ， 对 于 步 长 至 少 为 & 个 字 的 读 和 下 此 率 是 一 个 党 
数 速率 ， 是 由 从 L2 ЕН ТАЗЫ 的 速率 决定 的 。 

总 结 一 下 我 们 对 存 情 器 山 的 讨论 ， 存 储 器 系统 的 性 能 不 是 一 个 数字 就 能 描述 的 。 相 反 ， 它 是 一 
奉 时 间 和 空间 局 部 性 的 山 ， 这 座 山 的 上 升 高 度 差 别 可 以 超过 一 个 数量 级 。 了 明智 的 程序 员 会 试图 构造 
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亿 们 的 程序 ,使 得 程 谨 运 行 在 山峰 而 不 是 低谷 。 日 标 就 是 利用 时 间 局 部 性 ， 使 得 频繁 使 用 的 字 从 Li 
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中 取出 ， 还 更 利用 室 间 局 邦 性 ， 使 得 足 可 能 条 的 字 从 一 让 LL МТ ТА. 


= 


тп Жеми 
= 2 Š B Š 


= Ë 
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Жол -t Шш ИИК (ИЖ) 
БАНИ ТЕЕ 6.42 中 ағала KB BEI — PRI. 
15$ 538 6.18 | 
E642 PILAR u B Ғы PERTAAR KI Wik yE HU о + 
Pee | ! Ads? s danh д + 


Ж 6.19 | 
| fS X-B aa AR. ЗАНЕ ЕЕ HH S dp de F| nt [a] de) ТЕ 5 6 р 
ЕУ 642 TEMEL, ТАТАТ а 的 时 间 ， 以 CPU ЖАА 
fÈ: Е 
A. (EX ES LI d-cache. 
B. ТЕЗА ЕНІ ША. 
С. Ёё, 
Fik гт ЕЕ 大路 =] BM T-I6) H, ik Re x ROME rs, 


6.62 重新 排列 循环 以 提高 空间 局 部 性 
TEH nx n РЕФ МЫШ. C= AB. Hin, gina, ЖА 


> - |“ d ы 
Си ĉa] [än on | |і bz 


© = аб Ф aulis 
сіз = Qi + уруу 


iu 
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Сі = аури + dyn 


с» = а) + ab; 


XB КЕЗЕК ЖОЙТ ДЕЛИ = КЕНДЕ ЖЕШ, AUR ER SI EET. рк 1. E 
TREERE peti] ЕҢ), ПНЕ SUR Ж ЕЛ 0: BE EI I] 
Н.А, SHE 6,45 Pr. ТАКАОКА Е Е RR,  ( 


code/mem/matmult/mm,c 
1 for il = Ü; 1 < n; i++) 
2 for ij 2-0; j < n: ] -+) Í 
i sum = D.ü;. 
4 Гог [k = 0; K < n; К++) 
5 sum += A[1] [k] *BTk] [3]; 
б C[il[j] += sum; 
/ 


сөйеутет/тантитін.с 


(а) ЕЖ 


code/mem/matmuli/mm.c 
for (j = Ü: j < n; je*) 
for (і = Ü; i < n; i++) 1 
sum = 0.0; 
for (k = 0; K « n; К++) 
sum += A[I][k]*BIK] [3]; 
С[1][1] += sum; 


—1 mh LH ш ú b ҥе 


code/mem/matmult/mm.c 


(b) jik hic 


code/mem/matmulvimm.c 
1 0; J < n; J++) 

2 tor [k 2 O; k < n; k++) Í 

3 r = B[k] 3]; 

4 tcr {1 = Ú: 1 < n; i++}? 

а С[1][11 += A(ij[k]*r; 
6 


| 
code/mem/matmult/mm.c 
(с) А 
code/memn/ malmul lmm. 
1 tor (k = 0; K « n: К++) 
2 for (j = 0; - < n: j++) f 
3 r = ВІКІ|ЗІ; 
4 for (i -б;і < n; i++} 
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2 СПІГІ += Alil[k]*r; 


code/men/maimuli/mm.c 
( d) kii RE 


code/mem/matmult/mm. c 
for ik = 0; k < n; K++) 
for ii = Ü; i < n; i++} d 
r = Alil[ki; 
for {j = 0; j < n; j++} 
С{1]{1] += гЭБІКІГ2І; 


m ыл e Xn D A 


code/mem/matmult/mm.c 
(e) kij K+ 


сойе/тет/танншутт.с 
for (i = 0; 1 < n: 144) 
for ik =й; k < n; k++} { 
r - A[i][k]; 
tor (j = Ü; J < n: j++) 
С[1][11 += r*BIK: [i]: 


Oy C ag Мм [Юэ P 


code/mem/marmult/mm.c 
(f) ikj & < 
图 6.45 矩阵 乘法 的 六 个 版 本 


在 高 层 来 看 ， 这 六 个 版 本 是 非常 相似 的 。 如 果 加 法 是 可 结合 的 ， 那 么 每 个 版 本 计算 出 的 结果 完 
全 一 样 “。 每 个 版 本 总 共 都 执行 O(n’) 个 操作 ,而 加 法 和 乘法 的 数量 相同 。A 和 B 的 个 元 素 中 的 每 
一 个 都 要 读 1 IK. 计算 忆 的 站 个 元 素 中 的 每 一 个 都 要 对 0 MARR. 不过， 如 果 我 们 分 析 晤 里 层 循 
环 选 代 的 行为 ， 我 们 发 现在 访问 数量 和 局 部 性 上 还 是 有 区 别 的 。 为 了 这 次 分 析 的 旧 的 ， 我 们 做 了 如 
FRR: 

. 每 个 数组 都 是 一 个 double 类 型 的 nxn КИЕН. sizeof(double) = 8. 

s。 只 有 一 个 高 速 组 存 ， 其 块 大 小 为 32 35 (B232. 

e 数组 大 小 n 和 怨 大 ， 以 至 于 和 矩阵 的 一 行 都 不 能 完全 装 进 直 1 高 速 缓存 中 。 

. 编译 器 将 局 部 变量 存储 到 寄存 器 中 ， 因 此 特 环 内 对 局 部 变量 的 引用 不 需要 人 在 何 加 载 或 存储 

38%. 

图 6.46 总结 了 我 们 对 循环 的 分 析 结 果 。 注 意 六 个 版 本 成 对 地 形成 了 三 个 等 价 类 ， 用 最 内 屋 循 环 
中 访问 的 和 矩阵 对 来 表示 每 个 类 。 例 如 ， 版 本 永和 j 是 类 AB 的 成 员 ， 因 为 它们 在 最 内 层 的 循 珠 中 
引用 的 是 年 阵 ARB (MAE С). HFAA, WAH TEARM MA (1) AT 


2 正如 我 站 在 第 2 章 中 学 到 的 ， 泽 点 如 法 是 可 交换 的， 但 是 通常 不 是 可 结合 的 。 З, ШЕЖЕЖЕНРХОНКЯИ KR 
混在 一 起 一 一 存储 物理 属性 的 矩阵 常常 这 样 ， 那 么 息 设 浮 点 加 法 是 可 晴 合 的 也 是 合理 的 。 
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М CEO 的 数量 ， 每 侈 循环 迭代 中 对 A、B 和 C 的 引用 在 高 速 缓存 中 不 命中 的 数量 ， 以 及 每 次 迭代 
B EAS OSSA 

类 AB 例 程 的 里 层 循环 [图 6.45 GO Ж (b) ] 以 步 长 1] 扫描 数组 A 的 一 行 。 因 为 每 个 高 速 缓存 块 
保存 四 个 又 字 ，A 的 不 命中 率 是 每 次 太 代 不 命中 0.25 次 。 另 一 方面 ,里 屋 循 环 以 步 长 nn 扫描 数组 B 
的 一 1。 因 为 很 人 ， 每 次 对 数组 BB 的 访问 都 会 不 请 中 ， 所 以 每 次 选 代 总 共 会 有 1.25 次 不 命中 。 


ЖАҢ АН 加 载 每 次 TAEA | АЛАТЕ | BB 不 命中 每 次 | Стаф | 总 不 合 中 每 次 
本 (Ж) {МЕНЕ | 选 代 使 用 的 | 和 迭代 使 用 的 选 代 使 用 的 选 代 使 用 的 AREAN 


ijk & jik (AB) 0.25 1.00 0,00 1,2% 
Jki & kii (AC) 2 (0 00 1.00 2.00 
kij & ik; (RC) 2 | , (50 


图 6.46 旋 阵 乘法 里 层 循环 的 分 析 

六 个 版 本 分 为 一 个 等 价 类 ， 以 里 层 循环 中 访问 的 数组 对 来 表示 。 

类 АС 例 程 的 里 层 循环 | 图 645 (с) 和 (d) ] 有 一 些 问 题 。 每 次 选民 执行 遇 个 加 载 和 一 个 存储 
‘相对 于 类 AB 例 程 ， 它 们 执行 2 个 如 载 而 没有 存储 )。 第 一 ， PEARU E n HH АЖС К. 
ЖЕЛ Ларга, БАЖА ҚАНИЕВ. 注意， 与 类 АВ Е, ЯЭМЕ 
环 降 低 了 空间 局 部 性 。 

BC 例 程 {图 6.45 (е) 30 Cf) ] 展 示 了 一 个 很 有 趣 的 折 中 ， 使 用 了 两 个 加 载 和 … 个 存储 ， 它 们 楷 
АВ Е 个 存储 器 吉 作 。 男 一 方面 ， 因 为 里 层 循环 以 步 长 1 访问 模式 扫描 B 和 C 的 列 ， 每 
次 迁 代 每 个 数组 上 的 不 命中 府 只 有 025 次 不 命中 ， 所 以 每 次 选 代 总 共有 总 S0 个 不 命中 ， 

Ei 6.47 小 结 了 一 个 Pentium HI Xeon 系统 二 矩 阵 滋 法 各 个 版 本 的 性 能 。 这 个 图 加 出 了 每 次 里 导 
TERME IBS EHE EE Bb) CPU 周期 数 作 为 数组 人 小 (п) HAM. 


60-- — = 
30 1-7 


He 
| 


25 50 75 100 125 150 175 200 225 250 275 300 325 350 375 400 
Ng A (n) 
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5.47 Pentium Ill Xeon 和 矩阵 乘法 性 能 
ИІР; kiA jki ЖАС; ЫШ: Ж ВС. jk Ж]: ЖАВ. 
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对 于 这 幅 图 有 很 多 有 意思 的 地 方 值得 注意 ， 

* 对 于 大 的 n 值 ， 即 使 每 个 版 本 都 执行 相同 数量 的 浮 点 算术 操作 ， 最 快 的 版 本 比 最 惕 的 版 林 
运行 得 快 二 倍 ， 

. 存 情 器 访问 数量 和 局 部 性 都 相同 的 版 本 ， 有 大 致 相同 的 测量 性 能 。 

. 和 仔 储 性 能 最 糖 赚 的 两 个 版 本 ， 就 每 次 选 代 的 访问 数量 和 不 命中 数量 而 言 ， 明 显 地 比 其 他 四 
个 版 本 运行 得 慢 ， 其 他 四 个 版 本 有 较 少 的 不 命中 次 数 或 者 较 少 的 访问 次 数 ， 或 者 兼 而 有 之 。 

* 35 AB BIEE—EEOUATCH 2 个 存储 器 访问 和 125 次 不 命中 一 一 在 这 种 机 器 上 运行 得 比 类 
BC 例 程 一 -每 次 迭代 3 个 存 情 器 访问 和 0.5 次 不 命中 一 一 要 好 一 点 ， 后 者 用 一 个 额外 的 存 
情 器 访问 来 换取 较 低 的 不 命中 率 。 村 点 就 是 对 于 性 能 来 说 ， 户 速 缓存 不 命中 率 并 不 是 问题 
的 全 部 。 存 储 器 访问 的 数量 也 很 重要 ， 而 且 在 许多 情况 中 ， 找 到 最 好 的 性 能 就 是 竖 在 这 两 
者 之 间 做 出 权衡 。 练 习题 632 和 6.33 更 深入 地 论述 了 这 个 问题 ， 


6.6.3 ”使 用 分 块 来 提高 时 间 局 部 性 

企 寺 一 节 中 ， 我 们 看 到 一 些 很 管 单 的 循环 重新 排列 是 如 何 能 够 提高 空间 局 部 性 的 。 但 是 我 们 也 
在 到 ， 即 恒 司 用 很 好 的 循环 续 套 ， 每 次 御 环 迭代 的 时 间 都 狂 着 数组 大 小 的 增长 而 增长 。 发 生 的 事情 
是 这 样 的 ， 当 数组 大 小 增加 时 ， 计 间 局 部 性 降低 了 ， 而 高 速 缓存 中 容量 不 命中 的 数目 增加 了 ， 为 了 
改正 这 个 问题 ， 我 们 使 用 了 一 种 善 通 的 称 为 分 块 【blocking ) 的 技术 。 不 过 我 们 必须 指出 ， 与 那些 
为 了 提高 空间 局 部 性 的 简单 循环 变换 不 同 ， 分 块 使 得 代码 更 难 阅读 和 理解 。 因 此 ， 它 最 适合 于 忧 化 
编译 疾 或 者 频 莹 执行 的 库 例 程 。 不 过 学 习 和 理解 这 项 技术 仍然 是 很 有 趣 的 ， 因 为 它 是 -个 能 够 产生 
ЕЛЕ АНИ: 

分 块 的 大 致 思想 是 将 一 个 程序 中 的 数据 结构 组 织 成 称 为 块 【block) 的 组 块 (chunks)。( 在 这 个 
上 下 文中 ,，“ 拓 ” 指 得 是 一 个 应 用 级 的 数据 组 块 ， 而 不 是 高 速 缓 存 块 。) 这 样 构造 程序 ， 使 得 能 够 将 
一 个 块 加 载 到 L1 高 速 缓存 中 ， 并 在 这 个 块 中 进行 所 需 的 所 有 的 读 和 写 ， 然 后 丢掉 这 个 央 ， 加 载 下 
Г, ВОНА. 

ПЕ РВЕЗЕ НОТУ D. ЕВЕ TREE, БАЈАН аг ET 
矩阵 这 个 数学 依据 。 例如， 如 果 m =8， 那 么 我 们 可 以 将 每 个 矩阵 划分 成 四 个 4x4 ЕЕ: 


Ë c [e МК М 
Ca С» Ax А» | Ba By 


Cu = Anbu t+ Anba 
Co = АнВа%АрВу» 
Сы = АВ t Agba 
С» = АВ + AnB,, 


图 6.48 л ГЕЯ), RIRA bjk 版 本 。 这 段 代码 背后 的 基本 思想 是 将 
АЖС 划分 成 | x bsize 的 行 条 (row slivers)， 将 В 划分 成 bsize x bsize 的 块 。 最 内 层 的 Cj, 40 Я 
MOH B 的 一 个 块 去 乘 以 A 的 一 个 行 条 ， АЕ С 的 一 个 行 条 中 。 用 B 中 同一 个 块 ，i 循环 先 
RET A H C Hn TTA. 
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codefmnem/matmulifbrnm.c 
void bijkla)-ray А, array B, array C, int n, int Dsize) 
1 
int 1, j, Kk, kk, ijj; 
double sum; 
int en = bsize * í(n/bsize); /* Amount that fits evenly into blocks */ 


for iil = 0; l < n; i++} 
For (j = 0; j < n; j++} 
СПІГІІ = 0.0; 


Tor (ЕК = 0; kk < en; kk += bsize} ( 

Ü; 11] < en; jj += bsize) í 

i = Ü; i < n; i++} 14 

[J = Jj; 2 € jJ + bsize; j++) { 


окуз коа со з бал б осо | 
LO BR — c 


— 

“= 

ққ — I 
Ci г 

Ен, 


15 sum = С[1][1]; 

15 for (k = Kk; k < kk + bsize; k++} 1 
17 sum += A[i][k]*BiÍk] [3]: 

18 ) 

19 C[il[j] = sum; 

20 } 

21 | 

22 } 

23 } 

24 | 


code/mem/matmult/bmm.c 


H]ló.48 Jim 
这 个 简单 的 版 本 概 设 数组 太 小 (ny 是 块 大 小 (айе) 的 整数 倍 ， 


图 649 给 出 了 图 6.48 中 分 块 代码 的 一 个 图 形 化 的 说 明 。 关 键 思想 是 它 加 载 B 的 一 个 块 划 高速 
变 存 中 ， 使 用 它 ， 然 后 去 痢 它 。 对 入 的 引用 有 很 好 的 空间 局 部 性 ， 因 为 是 以 步 长 1 来 访问 每 个 行 条 
的 。 它 也 有 很 好 的 空间 局 部 性 ， 因 为 是 连续 bsize 次 引用 整个 行 条 的 。 对 B 的 引用 有 好 的 时 间 局 部 
性 ， 因 为 是 连续 n OX ia] bsize x bsize 决 的 。 最 后 ,对 CC 的 引用 有 好 的 空间 局 部 性 ， 因 为 行 条 
的 每 个 元 窒 是 连续 写 的 。 注 意 对 CC 的 引用 没有 好 的 时 间 局 部 性 ， 央 为 每 个 行 条 都 只 被 访问 一 次 。 








kk li 
[Te 
kk bsiza 
B 
bsize ТҮЛЕН 1 X bsize т 连续 л FH ШО | X baize 
bsize X bsize 的 块 i $ poe E 0л: Ж 


图 6.49 分 块 的 矩阵 乘法 的 图 形 化 说 明 
最 内 层 的 GA) АЯУ В 的 一 个 bsizeX byize ARER A А -个 1xasize 的 行 杀 ， 将 结果 放 到 CC 的 一 个 | x bsize 的 行 条 中 。 
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Г ЕИ ЕН. АНЬ КӨНЕСІ. ІН 6.50 展示 了 Pentium Ш Xeon 
ЕН ОНЕГЕ ЗЕЕ РЕВЕ Cbsize = 25)， 和 注意 ， 分 块 使 简 运 行 时 间 比 最 好 的 非 分 执 版 
本 提高 了 1 信 ， 从 每 次 选 代 大 的 20 个 周期 改进 到 每 深造 代 大 约 四 个 周期 。 另 一 件 关于 分 块 的 有 趣 
S IERI ANI 每 次 计 代 的 时 间 几 平 保持 不 变 Шы ыы 分 所 版 本 中 全 
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8 5.50 Pentium Ш Xeon КӘР = 
МНН. Бук 和 bikj ААВ ТЛ ЖЕГЕ Ж. RUM IET IRE бат bip IHR HR ВНЕ, REX. 
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67 ЖӘ: 利用 程序 中 的 局 部 性 


正如 我 们 看 到 的 ， 存 储 系 统 礁 组 织 成 一 个 存 赃 上 役 备 的 是 次 结 检 ， 较 小 、 较 快 的 设 答 常 近 顶 部 ， 
较 大 、 较 慢 的 设备 车 近 底部 。 由 于 这 种 层次 结构 ， 框 序 访问 存储 位 置 的 有 效 速率 不 是 一 个 数 富 能 指 
述 的 . 柑 皮 ， 它 是 一 个 变化 很 大 的 程序 局 部 性 的 函数 【我 们 称 之 为 存储 内 出 ) 变化 可 以 有 几 个 数量 
级 。 有 良好 局 帮 性 的 程序 从 快速 L1 A L 高 速 组 存 存 储 器 中 访问 它 的 大 部 分 数据 。 局 部 忻 差 的 种 序 
MED IRER DRAM 主 存 中 访问 它 的 大 部 分 数据 ， 
理解 存储 嵩 屁 次 结构 本 质 的 程序 员 能 够 利用 这 些 知识 ， 网 写 出 更 有 将 的 程序 ， 碟 论 乓 体 的 行 俏 
系统 结构 是 怎样 的 。 特 别 地 ， 我 们 推荐 王 列 技术 ; 
“ 兰 你 的 注意 力 集中 在 内 部 衢 趟 上 ， 大 部 分 计算 和 存储 器 访问 都 发 生 在 攻 里 。 
+ 通过 按照 数据 对 象 存储 在 存储 器 中 的 顺序 来 读数 据 ,， 从 而 使 得 你 程序 中 的 空间 局 部 性 最 大 。 
. 一 旦 从 存储 器 中 读 入 了 -个 数据 对 象 ， 就 尽 可 能 多 出 使 用 它 ， 从 而 使 得 你 程序 中 的 时 间 局 
部 性 最 大 。 
. 时 住 ， 不 命中 率 只 是 确定 你 代 介 性 能 的 一 个 因素 【 虽 狼 是 重要 的 )， 存 储 器 访问 数量 也 扮 狂 
ЖЕНЕ, GI ESO PI S IBS PETI. 


6.8 小 结 


基本 存储 技术 包括 RAM “随机 存储 器 }、ROM ( 非 易 失 性 存储 器 ) 和 磁盘 。RAM 有 两 种 基本 
RA, SRAM (静态 RAM) 快 一 些 ， 但 是 也 中 一 些 ， 它 区 可 以 用 做 CPU 芯片 了 上 的 高 速 缓存 ， 也 可 
АНА ЕН. Ж RAM (DRAM) 慢 一 点 ， 也 便宜 一 些 ， 用 做 主 存 和 图 形 帧 钥 冲 区 ， 
非 易 失 性 存储 器 ， 也 称 为 只 读 存 储 器 〈【ROM?， 妓 使 是 在 关 电 的 时 候 ， 也 能 保持 它们 的 信息 ， 它 们 
用 来 存储 可 件 〈《firmwarey。 磁 盘 是 非 易 失 性 存储 讼 备 ， 以 每 个 位 很 长 的 成 本 保存 大 量 的 数据 ， 代 价 
是 较 长 的 访问 时 间 。 

一 般 俐 言 ， 较 快 的 存储 技术 每 个 位 会 更 贵 ， 而 容量 较 小 。 这 些 技术 的 价格 和 性 能 属性 正在 动 
态 地 以 不 同 的 速度 变化 者 。 特 别 地 ，DRAM ИАЕА Е CPU 周期 时 间 。 系 统 通 过 将 存 
屠 器 组 织 成 存储 设备 的 层次 结构 来 弥补 这 些 差 异 ， 在 这 个 层次 结构 中 ， 较 洲 、 较 快 的 没 备 在 顶部 ， 
较 入 、 较 慢 的 议 备 在 底部 。 因 为 编写 良好 的 程序 有 好 的 局 部 性 ， 人 多 数 数据 都 可 以 从 较 疝 计 “ 88 
服 劳 ， 纤 有 果 就 是 存储 系统 能 以 较 高 层 的 速度 运行 ， 但 起 有 较 低 层 的 成 本 和 容量 。 

程序 员 可 以 通过 编写 有 良好 空间 和 时 间 局 部 性 的 程序 来 动态 地 上 改进 程序 的 运行 时 间 。 利 用 基 十 
SRAM МЕ АРЕН AEN Л E, EAM LI 高 速 缓存 取 数 据 的 程序 能 比 主要 从 存储 器 取 数 据 的 
程序 运行 得 快 过 一 个 数量 级 。 


参考 文献 说 明 

存储 诺 和 和 嵌 盘 技术 变化 得 很 快 。 根 据 我 们 的 经 验 ， 最 好 的 技术 信息 来 源 是 制造 商 维护 的 Web m 
ІП. 1% Micron. Toshiba. Hyundai. Samsung. Hitachi 和 Kingston Technology 这 样 的 公司 ， 提 供 了 
丰 宇 的 当前 有 关 在 储 设 备 的 技术 信息 。 同 M、NMaxtor 和 Seagate 的 页 面 也 提供 了 类 似 的 有 关 碰 盘 的 
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有 用 信息 。 

关于 电路 和 仙 辑 设计 的 教科 书 提供 了 基干 存 情 技术 的 详细 信息 [39，62]。 焉 EE Spectrum 出 版 了 
一 系列 对 DRAM 和 出 概述 文章 36]。 计 算 机 体系 结构 国际 会 说 (ISCA) 是 -个 关于 DRAM {FRATE RE 
特性 的 公共 论坛 [22，23]。 

Wilkes 号 了 第 -篇 大 十 局 速 缓 存 存 储 器 的 论 廊 人 多。Smith 写 了 一 篇 经 典 的 综述 [172]。Przybylski 
编号 了 - :本 基于 高 速 缓 存 设 计 的 权威 著作 [59]。Hennessy 和 Patterson RET Xf Pr Ж EL ja] Bl B! 
4 Ti if re [33]. 

Stricker ЙЕ], ЖАМ es REIS ЕШМ. КЕПТЕН ЖИГ fd 
述 牛 提出 了 术语“ 存储 器 山 ”. 编译 器 厂 究 者 通过 自动 执行 我 们 在 6.6 Tiri] ЕУ АЖЕ LAGE 
Ж, KBA 25, 45, 48, 54, 60, 89]. Carter 和 同事 们 提出 了 —1 ul W iE F ДИР 
КН Са cache-aware memory controller? [11]. Seward HÈ f ЕЛ ОНО S E CEU ETE 
FF. MOS cacheprof, АТ C ЖЕЛЕК АБАШ as ЕЕ БАЧАЧИ FITA Cwww.cacheprof. оге). 

XT Ap qug EE SER A OUS ХЕНӘЖ. ПЕНКА НЕ, jer 
ВЕ K. ЛО E 2 HEREB[I2, 28, 29, 57, 90]. ЖЛ Ж xS ETE IB RR CR El 
部 性 来 改进 磁盘 访问 性 能 的 方法 |6，13]。 像 Exokernel ХНК Т ГЕ ST 
源 的 用 户 级 控制 [38]。 像 安德鲁 文件 系统 [531 和 Codal67] 这 样 的 系统 , 将 存储 器 层次 结构 扩展 到 了 计 
算 机 网 络 和 移动 笔记 本 电脑 。Schindler 和 Ganger 开发 了 - -个 有 趣 的 工具 ， 它 能 自动 描述 SCSI ati 
张 动 器 的 构造 和 性 能 [68]。 


ЖЕТЕМ 

020 ФФ 

假设 要 求 你 设计 一 个 每 个 磁道 位 数 固定 的 磁浮 。 你 知道 每 个 磷 道 的 位 数 是 出 最 蛙 层 磁道 的 周 长 
确定 的 ， 你 可 以 幅 设 它 就 是 中 间 那 个 圆 洞 的 局 发。 因此， 如 果 你 把 磁盘 中 间 的 洞 敌 得 大 一 点 ， 每 个 
磁道 芍 位 数 就 会 增 大 ， 但 是 总 的 磁道 数 会 减少 。 如 果 用 > 来 表示 盘面 的 半径 ，x* .+ 表示 圆 洞 的 半径 ， 
ЖА х ЖОПА ЕНЕВ ОЧЫН Е д? 

6.21 € 

下面 的 表 给 出 了 ЖЛ ЛЕН О, ЛЕА РОТА ЕТГЕН GO. БІР 
W CO. ЖаН (s) 以 及 块 偏 物 位 数 (6)， 





622% 
这 个 问题 是 关于 练习 题 69 中 的 高 速 缓存 的 ， 
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A， 列 出 所 有 会 在 组 Y pier p SES а RE, 
В. 列 出 所 有 会 在 组 6 中 命中 的 十 六 进 制 存储 器 地 址 。 


623 ФФ 

=F КШ H PL ЕЖЕ: 

1 typedef int агтау141| [4]; 

2 

3 o void transpose2(array dst, array 8ӨгС} 
4 Í 

3 int i, J; 

5 

7 for [1 = ©; i < 4; із? 1 

д for (j = 0; J < 4; j++} Í 
: dst[j: [i] = вгс[1][1]; 
10 } 

_1 ) 

1200) 


假设 这 段 代码 运行 在 一 台 县 有 如 下 属性 的 机 器 上 : 

+ sizeol(int) = 4. 

4 数组 src 从 出 址 如 开始 ， 而 数组 dst АЛЫШ 64 开始 《二进制 )。 

. P- -AL 数据 高 速 缓存， 它 是 自 接 映射 、 直 写 、 写 分 灾 的 ， 抉 大 小 为 I6 7 0. 

. КЛАНЕ 9 ІЗЕТ, ЖАЛ. 

. Xj тс 和 dst 数组 的 访问 分 别 是 惟 的 读 和 写 不 命中 的 来 源 。 

对 十 每 个 row 和 сө, НЕҢ sre[row)[col)#l dt[rowl[col 的 访问 是 命中 《hb) 还 是 不 能 中 《my)。 
例如 ， 读 src[QJf0] 会 不 命中 ， 而 写 dst[0N[0] 也 会 不 命中 。 


dst БЕН 
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624 $4 
对 于 一 个 总 大 小 为 ЭН КЕНЕ, &EMNGÉH623. 
















сяо ят яо |as 
ЕЛЕС | p | 
ЛЕ БЕНЕН БЕНЕН 
Кии 

Lodo 
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3M BOE EFI СЕТ Zr. WAK EAE. ЖИП. dud [ocu E ҚЫТА А S CMYK 


(EE, £L, ЖЕ, ЖЕ) (B. 3M Ж {ЙИМ е FEDERE 7H 2048 字 节 、 直 接 映 射 、 块 大 小 为 
32 竹 广 的 数据 高 速 缓存 上 的 有 效 性 有 如 下 定 立 : 


1 struct point color { 

2 int c; 

3 int m; 

4 int ү; 

5 int k; 

5 ү; 

7 

ü struct point color square[1651116]; 
9 int i, j; 

Hur tes: 


н  sizeof(int) == 4. 
* square 起 始 于 存储 器 地 址 0。 
. HIM F 48282 2 , 
. 惟一 的 存储 器 访问 是 对 于 square 数组 中 的 元 素 。 变 量 1 和 j 被 存放 在 寄存 器 中 。 
确定 下 列 代 码 的 高 速 缓存 性 能 ， 
For {1 = Ü; l1 < 16; 1++!{ 
for (j = 0; j < 16; j++) Í 


1 
д 
1 squarefil(3].c = 0; 


450 %6% 


s&cuare[i'[3!.m = 9; 
square[i [j].y = li 
squareili, jl.k = 0; 


со — C л d 


} 

A, HUA EOM 

B. 在 商 速 缓存 中 不 命中 的 切 总 数 是 和 多少? 

С. атт Ж АЖ? 

626 Ф 

жетй 625 中 的 假设 ， 确 定 上 列 代 码 的 高 速 缓 在 性 能 : 


1 tor (1 = 0; 1 < i6; le 

2 tcr (j = D; j < 15; j++) Í 
3 aquare[j][i].e = Ü; 

1 guare [J] [il.m = E; 

5 sequare[^][|il].y = 1; 

б square[-][i].k = 0; 

- 

B 


} 

A. Уд S b 1 NEN 

ВАЛ ЫН SPESE? 

C. Aime E »? 

627 € 

ЗЕДІ 6.25 rh Ux. We РУАН ГЕ ЯЕ: 


l for {1 = Ó; 1 < 15; l++) į 


2 tar {у = бр J 16; j++) [Í 
3 aquarcili]lijl.v = 1; 
1 I 
а } 
5 tar {1 = 0; 1 « 15; 14411 
7 ісі 1] = Ü; J < 16; j++) d 
8 sequare[ij[3..c = Q; 
9 square[illj].m = t; 
10 square[i][jl.k = 0; 
] ] 
12 | 


А. t AES? 
B. 在 向 速 缓存 中 不 命中 的 写 总 数 足 多 少 ? 
C. Aaa = Eb? 
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6.28 %ф 

你 正在 编写 一 个 新 的 3D Ж, PAREPARE. TRERAEGP4ETS- ЖЖ. ЕҢ P д BU 
ЕТЕНЕ. POR A: СЕНО E 640x 480 像素 数组 的 。 你 工作 的 机 器 有 一 个 64KB 直接 映射 
高 速 缓存 ， 每 行 4 个 字 邓 。 你 使 用 的 C 数据 结构 为 ; 
struct pixel { 

char r; 

char g; 

char b; 

char a; 


к= 


Нн 


struct pixel buffer!489][640]1; 
iat 1, 1; 

Ü char *cptr; 

1] int *iptr; 


e p б gc << Cn Uno e Ls B3 


A Wm P Bo: 

e sizeof(char)--1 Жі sizeof(int)2-4. 

* buffer 起 始 于 存储 器 地 址 ， 

。 МАЙРА А. 

. ШУЛЕН ENT buffer ЕТІН Ж. ЖШ i. j. cptr 和 iptr 9791947. 
ТЕН РК БТЕ ТАА? 

1 tor ij 20; j < 640; j++) { 


2 for {1 = D: i « 480; 1++}/ 

3 buffer[i][3].r = 0; 

4 buffer[ill3l,g = 0: 

5 bufter[ill[j].b = 98; 

5 buffer[i][j].a = 0; 

7 

H } 

6.29 Ф%® 

ААА 6281, РЕКАТА £ bil ТЕА Нора? 
1 char *сріг = (char *) buffer: 

2 Гог [; ptr < {{{Слаг *) buffer) + 640 * 480 * 41; CDUT++) 
3 *"cptr = 0; 

63% ФФ 

给 定 练习 题 6.28 中 的 假设 ， 下 面 代码 中 百 分 之 多 少 的 写 会 在 高 速 缓存 中 不 命中 ? 
1 int *iptr = (int *)buff"vFer; 

2 tor (: iptr < {iint *jbuffer + 640*480!; iptrss) 

3 *1ріг = 0; 

631 $499 


从 CS:APP 的 网 站 上 下 载 mountain 程序 ， 在 你 最 喜欢 的 PCILinux 系统 上 运行 它 ， 根 据 结果 个 
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计 你 系统 上 L] 和 12 高 速 缓存 的 大 小 ， 
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FEMTEN. RAGUAR 5 бИЛЕРЕЗІНЖЕМНЕІ- 71 fr i ТЕН ЕМЕНІ 
的 代码 优化 问题 上 。 考虑 一 个 拷贝 并 转 置 一 个 类 地 为 int 的 NXN S8 ЕЮ. EAE ЖЕНЕ 
S#fIHWEEED, #{1#@ 1л Ж 中 捕 贝 到 d,。 只 用 一 个 简单 的 循环 就 能 实现 这 段 代码， 

1 void transpose[int *dst, int *src, int dim) 
I 

int i, 3; 


[ог ti = C; i < dim; i++) 
for (j = 0; j < dim; j++} 
dst[j*dim + 1] = src[:*dim + j]; 


| 


这 里 ， 过 程 的 参数 是 指 同日 的 矩阵 《dst) ЖЕНГЕ (өс) 的 指针 ， 以 及 和 托 阵 的 天 小 N Cim). 
或 想 恒 得 这 段 代 码 运 行 得 快 ， 需 要 两 种 优化 。 首 先 ， 虽 然 函 数 在 利用 源 钊 阵 芍 空间 局 部 性 上 做 得 很 
Я, HEENA N 值 的 日 的 矩阵 却 做 得 很 差 。 其 次 ，GCC 产生 的 代码 不 是 非常 有 效率 。 看 看 江 
弓 代 码 ， 我 们 知道 其 中 的 循环 需要 10 条 指令 ， 其 中 有 5 个 会 引用 存储 器 一 一 -个 引用 源 和 矩阵 ， 一 个 
引用 日 的 尘 阵 ，| 而 三 个 从 栈 中 读 局 部 变量 。 你 的 工作 就 是 解决 这 些 问 题 ， 设 计 一 个 运行 得 尽 可 能 快 
KH а LIS AI. 


633 9999 

这 项 作业 是 练习 证 5.32 的 ”个 有 趣 的 变 体 。 考虑 将 一 个 有 向 图 g ЖЛЕ АРУШ ESI EL р’. В 
ҮН Айди 到 顶点 v 的 边 ， 当 几 仅 当 原 图 g 中 有 - -条 日 到 v 或 者 v 到 u Xn. 图 g 是 出 如 下 
的 它 的 邻接 矩阵 〔adjacency matrix) G Xm E). ME N E £ 中 顶点 的 数量 ,那么 G 是 一 个 NXN 的 
矩阵 ， 它 的 元 素 是 全 0 或 者 全 1. 假设 g ЕЛАНА ТАЙ: музун. 那么 如 果 有 :条 从 v 
到 Yi 的 过 ， 那 么 G 和 由 为 1， 否则 为 9。 注意 ， 邻 接 牛 阵 对 角 线 土 的 元 素 总 是 L, MA in SS 
阵 是 对 称 的 。 只 用 -个 简单 的 答 坏 就 能 实现 这 段 代 码 ; 

1 võid col convert(int *G, int dim) { 
int 1, 1; 


for {1 = б; i < dim; i++) 
for i] = 0; i < dim; j++? 
G[j*dim + i] = Gf[j*dim + i] || G[i*dim + 3]; 


— ch i nn js бы [у 


) 
RE L TEE ВИ Tistrf8F n Beb Кри 6. DS E 7 EAT, б ШУЛ 
你 在 第 5 SERUS 6 章 中 所 学 到 的 概念 。 
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练习 题 6.1 59 
这 时 的 思想 是 通过 第 纵横 比 maxtrcymintre) 最 小 ， 使 得 地 址 位 数 最 小 。 换 各 话说 ， 数 组 越 接近 


S W SS E ЖАА 453 


Бір, НДЕ Ир, 









max(b., 5.) | 


ааа 
аа аа 
wr Тури зур 3 
(me а а 5 У 
练习 题 6.2 9 
这 个 小 练习 的 主 骨 是 确保 你 理解 柱 面 和 磁道 之 间 的 关系 。 一 旦 你 弄 明 白 了 这 个 关系 ， 屠 问题 就 
很 简单 了 : 





ыш | + | S 


Disk Sl2bytes 400 sectors 10000 tracks, 258rfaces — 2piatters 
capacity T — sector ^ tack — 5 surface "^ plater < disk 
= 8192000000 bytes 
= 8.92GB 
练习 题 6.3 答案 
对 这 个 问题 的 解答 是 对 磁盘 访问 时 间 公式 的 直接 应 用 。 平 均 旋 转 时 间 【 以 ms АЙЫУ) 为 
Fag глайоп 一 1/2 x T max rotatii 
= 1/2 х (60 secs/15 000 RPM )х1000 ms/sec 
= 2 my 
EXE BU 
Tog range = ( 005ес5/15 000 RPM) x1/500 sectors track x 1000 те/зес 
= (008 ms 
世 地 来 说 ， 总 的 预计 访问 时 间 为 
T access = Tovg seek T Tovg rotation + Tg ttansfer 
= 8 ms+ 2 ms +0008 ms 
= |1075 
练习 是 6.4 ЕЖ 


为 了 创建 一 个 步 长 为 1 的 引用 和 模式， 必须 改变 循环 的 次 序 ， 人 司 得 最 右边 的 索引 变化 得 最 快 : 
1 int sumarray3d(int а[мі [к рм) 

2 { 

3 int i, J, k, sum = 0; 

5 

5 


for (k = D; K < N; k++! 1 
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6 for [i = 0; 1 < N: i++} Í 

7 for (3 = U; J < N; J++) Í 
8 sum += alkl[il[j}; 

9 } 

10 } 

11 } 

12 return sum; 

43-1 


МЕДЕ, EG ERE f Ж АИ АН ФАН ҮЗЕ 1 VS 
lu PX 

ж] 6.5 ЖЖ 

dux n Bn eT 8 IH Ung ge nn ТЕТТЕ ФЕН НЕШ. Жз ЙТ НАН д E clearl 
以 步 长 为 1 КЕНИЯ, Н АНЯ ЖЕНЕКЕ НЕЕ. UE clear? 依次 扫描 М 个 结 
构 中 的 每 一 个 ， 这 是 好 的 ， 但 是 在 每 个 结构 中 ， 它 以 步 长 不 为 工 的 模式 贞 划 下 列 相当 于 结构 延 始 售 
ERE: 0、12、4、16、8、20。 所 以 clear? 的 空间 局 部 性 比 clearl ЇЧ ЖЕ. АЖ с1сат3 不 仪 在 
每 个 结构 中 跳 来 跳 去 ， 而 用 还 从 结构 跳 到 结构 ， 所 以 clear 的 空间 局 部 性 比 clear? 和 clearl ЕЖ, 


练习 题 6.6 答案 
这 个 解答 是 对 疼 626 中 各 种 高 速 缓存 参数 定义 的 直接 应 用 。 不 者 么 令 人 兴 音 ,但 是 让 你 能 天 下 
理解 高 速 缓存 是 如 何 丁 作 的 之 前 ， 你 需要 理解 高 速 缓存 的 结构 是 如 何 导 致 这 样 划 分 地 址 位 的 。 





练习 题 6.7 EX 
填 刘 消除 了 剖 窒 不 命中 。 由 此 ， 丫 分 之 三 的 引用 是 命中 的 。 


练习 题 6.8 答案 

有 时 候 ， 理 解 为 什么 某 种 思想 是 不 好 的 ， 能 够 帮助 你 理解 为 什么 另 :种 是 好 的 ， 这里， 我 们 看 
到 的 十 的 想法 是 用 高 位 来 索引 高 速 缓存 ， 而 不 是 用 中 间 的 位 ，。 

A. На, ЗЕРЕНІҢ (сінік) 是 几 2 个 块 组 成 的 ， 这 所 ЛИЛИ. LA 
此 ， 数 组 头 并 个 连续 的 块 部 会 映射 到 组 0， 接 下 来 的 并 个 坎 会 映射 到 组 1, МК. 

B. 对 于 直接 映射 高 速 缓存 (S.E.B,m) = (512.1.32.32)， 癌 速 缓存 容量 是 512 个 32 ТТ, 每 个 
EAE ЛЕЛ t=18 个 标记 位 。 因 此 ， 数 组 中 蒜 2 个 块 会 映射 到 组 0， 接 下 来 2 个 块 会 映射 到 组 
1]， 因 为 我 们 的 数组 只 出 4096/32-512 个 所 组 成 ， 所 以 数组 中 所 有 的 块 都 被 映射 到 组 0. 因此， 人 在 任 
何 时 刻 ， 高 速 缓存 至 多 只 能 保存 一 个 数组 协 ， 妈 使 数组 足够 小 ， 能 够 完全 诚 到 疝 速 组 人 中 。 很 明显 ， 
ВЕ АЕА ВТ. 


存 情 器 层次 结构 


练习 题 6.9 答案 
PT E EAM CO》， 然 后 是 三 位 的 组 索引 (CD, WTA (CT): 
12 11 10 9 g 7 5 5 4 1 2 l Ü 





练习 题 6.10 答案 
ЊЕ: DxDE34 
A. 地 址 格式 【每 个 小 格子 表示 一 个 位 ) 
12 H 10 Š Ë 7 б 5 4 3 2 1 Ü 
pojrjsrjrjo[ojoyjyr o rio[rjo[o 
CT CI CT CT CT CT CT CT CI CI Ct CO CO 


B. ИЕН: 


Гаханиав CO | шю _ 
AE ESI (CI | O5 | 


高 速 缓存 标记 《CT) 
高 速 缓存 命中 吗 ? (YN) 
高 速 缓存 返回 的 字 节 оов | 





练习 题 6.11 答案 
地 址 : OxODDS 
A. 地 址 格式 《每 个 小 格子 表示 一 个 位 》 
i2 11 lü 5 8 T $ 3 4 4 2 1 0 
оаа оао ао ао 
CT CT CT CT СТ СТ СТ СТ СІ ГІ СІ CO CO 


В. 社情 器 引用 ; 













па sss. 
Fr 
Er ЖЕН БЕН 


练习 题 6.12 答案 
地 址 ，Dx1EFd4 
А. 地 址 格式 “每 个 小 格子 表示 一 个 位 》; 
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CT CT СІ СІ CT CT CT CT CD 


B. 1791: 


ж а a 
0 | 
[ae [| 


55188 6.13 ЖЖ 

这 个 问题 是 练习 题 6.9 一 6.12 的 一 种 逆 过 程 ， 要 求 你 反 向 工作 ， 从 高 速 缓存 的 内 容 推 出 会 在 某 
个 组 中 命中 的 地 址 。 在 这 种 情况 由, 组 3 包含 … 个 有 效 行 , 标记 为 0X32。 因 为 组 中 只 有 一 个 有 效 行 ， 
四 个 地 址 会 命中 。 这 些 弛 址 的 二 进 制 形式 为 001100100 11хх. БЕ, 在 给 3 中 命中 的 四 个 十 六 进 制 
ЯНЕ: 0х064С. 0х0640. 0х064Е 和 OxO64F. 


练习 题 6.14 ЖЖ 

A 解决 这 个 问题 的 关键 是 模 像 出 图 6.51 中 的 图 像 。 注意 ， 每 个 高 速 缓存 行内 包含 数组 的 一 个 
行 ， 高 速 组 存 正好 只 够 保存 一 个 数组 ， 而 且 对 于 所 有 的 1、sre 和 dst 的 行 映 射 到 癌 一 个 高 速 缓存 行 ， 
因为 高 速 绥 存 不 够 人 人， 不 足以 容纳 这 两 个 数组 ， 所 以 对 一 个 数组 的 引用 总 是 驶 逐 出 另 一 个 数组 的 有 
用 的 行 。 例 如 ， 对 dst[0][9] 写 会 驱 远 当 我 们 读 sre[0][0] 时 加 载 进来 的 那 -… 行 ， 所 以 ， 当 我 们 接 КЖ 
i$ sre[0][1 时 ， 我 们 会 有 一 个 不 命中 。 











++ 
| 0 B NE dr 
gre 
Line Ü 


16 , 
dat I Lina 1 


5.0651 8518 6.14 НУ 










一 [ep 一 Ha 


В. BERTA 32 子 节 时 ， 它 足够 大 ， 能 容纳 这 由 个 数组 。 内 此 ， 所 有 的 不 命中 都 是 开始 时 
的 冷 不 命中 。 
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ЖЫШ 6.15 ЖЖ 

每 个 16 ЕЛИ ТТЕ А Ж ЮЕ algae position 结构 。 每 个 循环 按照 存储 器 顺序 访 
问 这 些 结 构 ， 每 次 读 一 个 整数 元 素 。 所 以 ， 每 个 循环 的 模式 就 是 不 命中 、 命 中 、 不 命中 、 命 中 ， 本 
此 类 推 。 注 意 ， 对 于 这 个 问题 ， 我 们 不 必 实 际 别 举 出 读 和 不 命中 的 总 数 ， 就 能 预测 出 不 命中 率 ， 

А. ЖИД 512 М. 

B. 高 速 缓存 不 命中 的 读 总 数 是 多 少 ? 256 个 不 命中 。 

C. 不 命中 率 是 多 少 ? 256/512-50%. 


练习 题 6.16 答案 

ХА I 8] В CE XB НИЛ НИЕ 12. 所以， 按照 列 顺 序 来 扫描 数组 
的 第 二 部 才 会 豫 逐 扫描 第 一 部 分 时 加 载 进 来 的 那些 行 。 例 如 ， 读 gridp16]T0] 328 — 76 3€ НЕҢ 
我 们 读 gridI0][0i 的 元 素 时 加 载 进 来 的 那 一 行 。 这 一 行 也 包 合 eri] 所 以 ， 当 我 们 开始 扫描 下 -- 
列 时 ， 对 grid[0][1] 第 -~ 个 元 素 的 引用 会 不 命中 ， 

А, ERA RE E? 512 个 读 。 

B. 具 速 缓存 不 命中 的 读 总 数 是 和 多少? 256 个 不 命中 。 

С. 不 命中 率 是 多 少 ? 256/512=50%, 

D. Же Н ИТ А, ЖАЛИО Л? ШЕННЕН К, ДАР: 
Hee КАРЕЛ рпа AH. ТЕЛ ЕЛТАНУ Дар, mad agp x 1/4-25%. 

练习 题 6.17 ЖЖ 

这 个 循环 有 很 好 的 步 长 为 1 的 引用 模式 ， 因 此 所 有 的 不 命中 都 是 最 开始 时 的 尘 不 命中 。 

А. W S e b? 512 个 读 。 

B. 词 速 缓存 不 命中 的 读 总 数 是 名 少 ? 128 个 不 命中 。 

C. 不 命中 率 是 多 少 ?256/$12=#0%。 

D. 如 和 采 凯 速 缓存 有 两 倍 大 ,那么 不 命中 率 会 是 多 少 呢 ? 无 论 高 速 缓存 的 大 小 增加 多 少 ,都 不 会 
u A Р, ЯЛАН W S ËJ. 

练习 题 6.18 答案 


这 个 问题 只 是 检查 你 是 否 理解 了 我 们 的 讨论 。 步 长 对 应 于 空间 局 部 性 ， 工 作 集 大 小 对 应 于 时 间 
局 部 性 。 


练习 题 6.19 答案 

A. L1 ЕЕ {ЕТЕШ Ж KHA 1000 MBis， 而 时 钟 频率 大 约 为 500 MHz. БІН, НІЛ 中 的 一 个 
МЕТЕ 500/1000 X 4 — 2 个 周期 。 

B. ЖДИ L2 的 访问 时 间 ， 我 们 沉 要 确认 在 赃 器 山上 的 -- 个 区 域 ， 其 中 每 个 引用 都 在 L1 中 不 
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mE, HE L2 中 命中 。 特 别 地 ， 我 们 想 要 这 样 一 个 区 域 ， 忆 工作 集 对 L1 Ж ИККТ. AAE L2 
Ното, 92 ру UM, 256 7 5» 号 步 长 超过 了 行 的 大 小 例如 ， 步 长 为 16 个 字 )。 从 存 全 器 山 的 图 
中 ， 可 以 狗 察 到 该 区 域 【 工 作 集 大 小 =256， 步 长 =16)》 mE UE A X 92g 300 MB/s. HE, 8 
IM АА L2 中 读 ЗЕ Ж КЁ) 500/300X 4=7 个 周期 ， 

机 估计 主 存 的 访问 时 间 ， 我 们 看 看 山上 那个 步 长 和 工作 集 部 最 大 的 点 ， 其 中 每 个 引用 都 在 LI 
MI L2 中 不 命中 , 根据 这 幅 图 , 这 个 区 域 (上 作 集 大 小 =8M, 步 长 =16) КЕЕШ Ж AA А 80 MB/s, 
因此 ， 我 们 估计 从 证 存 中 读 出 一 个 宇 大 约 需 蜗 500180X4=25 个 周期 。 


| 


”第 2 部 分 
在 系统 上 运行 程序 


小 / 续 我 们 对 计算 机 系统 的 探索 ， 进 一 步 来 看 看 构建 和 运行 程序 的 系统 软件 。 链 
Ж Ress ms imme tennt 处 理 器 可 以 将 这 个 六 件 
; 一 加 载 到 存 情 器 (memory )， 并 且 执 行 它 。 现 代 操 作 系 统 与 硬件 合作 ， 为 每 个 
ызым UL 各 序 提供 一 种 包 像 ， 好 像 这 个 程序 是 在 独占 好 使 用 处 理 器 和 主 存 ， 而 实际 上 ， 在 任何 
时 刻 ， 系 统 上 都 有 多 个 程序 在 运行 。 因 此 ， 要 想 乍 这 样 的 系统 上 获得 准确 的 测试 值 ， 
就 需要 敏锐 的 油 索 力 和 小 心 的 设计 规划 。 

在 本 书 的 第 一 部 分 ， 你 很 好 地 理解 了 程序 和 硬件 之 间 的 区 互 关系 。 本 书 的 第 二 部 
分 将 拓宽 你 对 杀 绒 的 了 解 ， 使 你 率 固 地 掌握 程序 和 操作 系统 之 间 的 交互 关系 。 你 将 学 
习 到 如 何 使 用 操作 系统 提供 的 服务 来 构建 系统 级 程序 ， 例 如 Unix shell 3035225828 
分 配 包 。 
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链接 【linking) MERTER rura a ERES 5 А. ILE, УХ 
可 被 加 载 (aje l) BEIER АИТ. 链接 可 以 执行 于 编译 时 (compile time), IE SLE (ES IOS 
梓 番 译 成 机 器 代码 时 ， 也 可 以 执行 于 加 载 时 〈load time)， 也 就 是 在 程序 被 加 载 器 〈]oadef) 加 载 到 
企 悄 器 并 执行 时 ， 甚 全 执行 于 和 运行 时 (run time》， 由 应 用 程序 来 执行 。 在 早期 的 计算 机 系统 中 ， 链 
接 是 手动 执行 的 、 在 现代 系统 中 ， 链 接 是 由 叫做 链接 器 《linkery 的 程序 自动 执行 的 。 

狂 接 器 在 软件 开发 中 扮演 者 一 个 关键 的 角色 ， 内 为 它们 使 得 分 离 编 译 (separate compilation) 成 
为 可 能 。 我 们 不 用 将 个 大型 网 应 用 程序 组 织 为 “个 已 太 的 源 交 件 ， 和 出 是 可 以 把 它 分 解 为 更 小 、 更 
好 管理 的 模 鼎 ， 可 以 独立 他 媒 改 和 编译 这 些 模 块 。 当 我 们 改变 这 些 模块 中 的 一 个 时 ， 我 们 只 要 简单 
地 重新 编 评 它 ， 并 将 它 重新 链接 到 应 用 [-， 而 不 必 重 六 编 评 具 和 亿 艾 性。 

链接 通常 是 由 链接 髓 来 安静 地 处 理 的 ， 对 于 那些 在 编程 入 门 课 营 上 移 造 小 程序 的 学 生 向 二 ， 链 
接 不 是 一 个 理 旧 的 议题 。 那 为 什么 还 要 这 人 么 麻烦 地 学 习 关 于 链接 的 知识 了 呢 ? 

о REGE RYE TAKLA., 构造 人 型 程序 的 程序 员 经 常会 衣 到 由 于 身 少 模块 、 缺 少 

亩 或 者 不 兼容 县 库 霹 本 引起 的 链接 器 错 演 。 队 非 你 理解 链接 器 是 如 何 解 析 引 用 、 村 么 是 库 
以 太 链 接 串 是 如 何 使 用 库 来 解 相 引 用 的 ， 人 省 则 这 类 错误 将 令 你 感到 迷 感 和 棱 败 。 

。 理解 链接 器 将 帮助 你 避 免 一 些许 险 的 编程 错误 。Unix 链接 器 解析 符号 引用 时 所 做 的 决定 可 
以 不 动 声色 地 影响 你 程序 的 正确 性 。 在 默认 情况 卜 ， 错 误 地 定义 多 个 全 局 变量 的 程序 将 通 
过 链接 器 ， 而 不 产生 导 何 痪 二 信息 。 申 此 得 到 的 程序 会 产生 令 信 述 惑 的 运行 时 行为 ， 而且 
非常 难以 调试 . 我们 将 癌 你 展示 这 是 如 和 何 发 生 的 ， 以 及 该 如 何 避 免 它 。 

. 理解 链接 将 帮助 你 理解 语言 的 作用 域 规则 是 如 何 实现 的 。 例 如 , 全 局 和 局 部 变量 之 间 的 区 草 

是 什么 ? 当 你 定义 一 个 具有 静态 属性 的 变量 或 者 冰 数 时 ， 到 底 实际 意味 着 什么 ? 

。 理解 链接 将 帮助 你 理解 其 他 重要 的 系统 概念 ЕРМЕН МІН CEP E ЕҢ ЖЫЛ 
ВЕ KRENE, EWART ETRA a ATi ВА. 

。 理解 链接 将 使 你 能 够 开发 共享 库 。 多 年 以 来 ， 链 接 都 被 认为 是 相当 简单 和 无 趣 的 ,然而 ， 随 
者 共 孕 库 和 动态 链接 在 现代 操作 系统 中 日 蔓 如 强 的 重要 性 ， 链 接 成 为 了 一 个 复杂 的 过 程 ， 
它 为 知识 丰 昼 的 程序 员 提 供 了 强大 的 能 力 。 比 如 ， 许 多 软件 产品 使 用 共享 库 企 运行 时 来 升 
级 压缩 包装 的 (shrink-wrapped) 一 进 制程 序 。 还 有 ， 大 多 数 Web 服务 器 都 依赖 于 共享 库 的 
动态 链接 来 提供 动态 内 容 。 

这 一 前 提供 了 关于 链接 各 方面 的 一 个 彻底 的 讨论 ， 从 传统 静态 链接 ， 到 加 载 时 的 共享 库 的 动态 
链接 ， 以 及 到 运行 时 的 共 早 库 的 动态 链接 .我 们 将 使 用 实际 示例 来 描述 基本 的 机 制 ， 调 县 我 们 将 识 
放出 链接 问题 芷 哪些 情况 中 会 影响 你 程序 的 性 能 和 正确 性 。 为 了 使 描述 其 体 和 可 理解 ， 我 们 的 讨论 
д РАЕН: 一 台 1А32 机 器 ， 上 面 运 行 着 某 个 版 本 的 Unix, ËR Linux 或 者 Solaris， 使 用 
РАЙ ELF H 标 文件 格式 。 然 而， 无 论 是 什么 样 的 操作 系统 、ISA 或 者 是 日 标 文件 格式 ， 基 本 
HEREC ERE. ARBIA -总 是 很 重要 的 。 细 告 可 能 不 尽 相 同 ， 但 是 概念 是 相同 的 。 
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ЖЕН 7.4 PES CUT ERU PNIS РЕ, mainc 和 swap.c, В mangih A swap， 它 交换 
外 部 全 局 数组 ЛЫН Ал. 一般 认为 ， 这 是 一 种 奇怪 的 交换 两 个 数字 的 方式 ， 但 是 它 将 作为 
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МЕД APEERE ЖИПТИН: T SERERE D 1 TERI 729 CEA US 

大 多 数 编译 系统 提供 编译 驱动 程序 Compiler driver), WAAD., TRES TGK ARE БАЯ, 
编译 器 、 汇 编 跨 和 链接 器 。 比 如 ， 要 用 GNU 编译 系统 构造 示例 程序 ， 我 们 就 要 通过 在 shell 中 输入 
下 列 命令 行 来 调用 ССС ЖАЛЫН 

unix > gcc -02 -g -0 p MAIN.C swap.c 


codeftink/main.c 


* * 
code/tink/main.c 1 P" swap.c / 
| 2 extern int bufi]; 
1 /* main.c #7 3 
" 1 " 
^ void swapl); 4 int *bufp0 = &buf[0]; 
~ | | 5 int *pufpl; 
4 int ри [2] = 41, 2): є 
б 
- | 7 void swap!) 
É int ma ni) 
қ В { 
{ д int temp; 
B Смар гі; 10 
9 return 0; 11 bufpl = &buf(ll; 
10 ] | 17 zemp = *bufp0ü; 
code/tink/main. c 13 *bufpü = *bufpl; 
14 *bufpl = temp: 
15 1 
а) mine waww 
图 /1 示例 程序 | 


这 个 示例 程序 由 网 个 源 文 伯 组 成 ，mainc 和 мерс. main 函数 初始 化 一 个 隔 元 素 的 整数 数组 ,然后 调用 wap ECKE T OX 
ADEL. 


图 7.2 fS ТЖ ТЕЛ ZERO REEF А. ASCI 8338 CEREREM REAL EL ЯН ҒАТ АЯ. Cn 8. 
WA B aB RAPERE. Ну 选项 来 运行 GCC.) AEF B ЖЕТТ C 预 处 理 器 (cpp}, CHCH 
源 程序 maine 釉 译 成 一 个 ASCI 码 的 中 间 文 件 maini: 

срр [other arguments] main.c /tmp/ma:n.i 

接 下 来 , 驱动 程序 运行 C 编译 跨 (ec1)， 它 将 maini 翻译 成 一 个 ASCH 汇编 语言 文件 为 mains, 

ccl /tmp/main.i main.c -02 [other arguments] -о /tmp/main.s 

Жр, RSS ARS Cas), CURE mains 翻译 成 -个 可 重 定位 目标 文件 (relocatable object 
file) main.o: 

as [other arguments] -o /tmp/main.o /tmp/main.s 

Jes ERE £e DG o] ase L pk swap.0。 最 后 ， 它 运行 链接 器 程序 d. Ж maino 和 swap.o 以 及 
ЗЕК АЖА РА ЕЖ, GET TT BUT 8 В Я (executable object file) p: 

id -o p [system object -iles and args] /tmp/main.o /tmp/swap.o 

要 运行 可 执行 文件 p， 我 们 在 Unix shell 的 命令 行 上 输入 它 的 名 字 :， 


unix» ./p 
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тат. wap. уа 


ДЕЕ йт Ж 
{срр, ccl, as) [cpp, cel, as) 





màn. Swag.c R| Ë SE ËJ H 5g x E 


O BRB UD | 
完全 链接 的 
可 执行 日 标 文件 
图 /< BOE 
链接 器 将 可 重 定位 日 标 文件 组 合成 一 个 可 执行 习 标 文件 


shell 调用 个 在 操作 系统 中 天 做 加 载 器 (loader) HEN, EH T пут Е p 中 的 代 得 和 数 
据 到 存储 器 ， 然 后 将 控制 转移 到 这 个 程序 的 开头 。 
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像 Unix ld 程序 这 栏 的 静态 链接 器 Cstatic linker) 以 一 织 可 重 定位 目标 文件 和 命令 行 参数 作为 输 
А, ER 个 完全 链接 的 可 以 加 载 和 运行 的 可 执行 晶 标 交 忻 作为 输出 。 输 入 的 可 重 定 位 日 标 交 件 出 
各 种 不 同 的 代 公 和 数据 节 (section》 组 成 。 指 令 在 一 个 节 中 ， 初 始 化 的 全 局 变量 在 另 一 个 节 中 ， 而 
术 初 如 化 的 变量 又 在 男 外 一 个 节 中 。 
为 了 创建 可 执行 文件 ， 链 接 器 必须 完成 两 个 主要 任务 ， 
. 符号 解析 symbol resolution)。 日 标 文 件 定义 和 可 用 苦 号 。 符 号 解析 的 站 的 是 将 每 个 符号 引 
用 和 一 个 蔡 导 定义 联系 起 来 

ә 重 定 位 【relocation)。 编 详 器 和 汇编 器 生成 从 地 址 零 开始 的 代 凤 和 数据 节 。 链 接 器 通过 把 每 
ТА Ху 个 存储 路 位置 联 系 起 来 ， 然 后 修改 所 有 对 这 些 行 号 的 引用 ， 合 得 它们 指 秆 
这 个 存储 器 位 置 ， 从 而 重 定 位 这 些 节 。 

接 下 来 的 内 容 将 更 加 详细 地 描述 这 些 仔 务 。 在 你 阅读 的 时 候 ， 茧 记 往 关于 链接 器 揭 一 些 基 本 事 
X: 朋 标 文件 纯粹 是 宇 节 顽 的 集合 ， 这 些 块 中 ， 有 些 包 售 程 序 代码 ， 有 些 则 包 售 程序 数据 ， 而 其 他 
的 则 包 合 指导 链接 眉 和 加 载 器 的 数据 结构 。 链接 器 将 这 些 块 连接 起 来 , 确定 被 链接 块 的 运行 时 位 置 ， 
并 且 修 改 代 码 和 数据 块 中 的 各 种 位 置 。 链 接 器 对 目标 机 器 了 解 其 少 ， 产 生日 标 文 件 的 编译 器 知 汇 纺 
能 已 经 完成 了 大 部 分 起 作 。 


73 目标 文件 
时 标 文件 有 三 种 形式 ， 


° 可 重 定 位 目标 式 件 ,包含 二 进 制 羽 码 和 数据 , 其 形式 可 以 在 编 详 时 与 其 他 可 重 定位 日 标 文件 
合并 起 来 ,创建 一 个 可 执行 日 标 文 件 。 
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可 执行 目标 文件 ， 包 舍 二 进 制 代码 利 数 据 ， 其 形式 可 以 被 直接 拷贝 到 存 情 回 并 执行 ， 
e 共 吝 自 标 文件 。 一 种 特约 类 型 的 可 重 定位 日 标 文 件 ， 可 以 在 加 载 或 者 运行 时 ,被 动态 地 加 载 
到 存储 器 并 链接 ， 
编译 器 和 汇编 回 生 成 可 重 定位 日 标 文 件 ( 包 描 共 享有 是 标 文 件 )。 链 搂 器 生成 可 执行 目标 文件 。 从 
技术 上 来 说 ， 一 个 目标 模块 《object module) 对 是 一 个 字 节 序列 ， 而 一 个 目标 文件 (object Ше) 8 
是 一 个 存放 在 磁盘 文件 中 的 目标 模 氛 。 不 过 ， 我 们 还 是 互 换 地 使 用 这 些 术 语 。 
各 个 系统 之 间 ， 日 标 文件 略 式 都 不 相同 。 第 一 个 从 外 尔 实验 宇 诞 后 的 Unix 系统 使 用 的 是 а.ош 
HX (EREK. MAXAR RE aout 文件 )。System V Unix 的 早期 版 本 使 用 的 是 COFF 
(Common Object File format, -R E b X ERE X. Windows 使 用 的 是 COFF АУ — 38436, ПИ PE 
(Portable Executable, Р п) Bl) x. MA Unix Ж --ІРШ Linux, 8 System V Unix 
后 来 的 版 本 ， 各 种 BSD Unix, UR SUN Solaris 一 一 使 用 的 是 Unix ELF (Executable and Linkable 
Format， 可 执行 和 可 链接 格式 )。 尽 管 我 们 的 讨论 集中 在 ELF 上 ， 但 是 不 管 是 哪 种 格式 ， 基 本 的 概 
念 是 相 羽 的 。 


74 可 重 定位 目标 文件 


图 7 了 73 展示 了 -- 个 典型 的 ELF т ЖАУ His x fF. БЕР Ж (ELF header). 以 一 个 16 字 节 的 序列 
齐 始 ， 这 个 序列 描述 了 字 的 大 小 和 生成 该 文件 的 系统 的 字 节 上 顺序 、ELF 头 利 下 的 部 分 包含 帮助 链接 
大 解析 和 解释 目标 文件 的 信息 。 其 中 包括 ELF 头 的 太 小 ， 目 标 文 件 的 次 型 《比如 ， 可 重 定 位 、 可 执 
行 或 者 是 共享 的 )、 机 器 类 型 (比如 ，IA32)、 季 头 部 表 (section header table) УНАН, UL ACH 
头 部 表 中 的 表 目 大 小 和 数量 。 不 同 节 的 位 置 和 大 小 是 由 节 头 部 表 横 述 的 ， 其 中 日 标 交 件 中 每 个 节 都 
有 一 个 国定 大 小 的 表 日 (entry)。 














ПИЕСИ 
‚деһиа 


73 ЁШ ПРШ ЕНЕ 


Xt ELF 头 和 和 节 头 部 表 之 间 的 都 是 节 。- -个 典型 的 ELF ОГ {УН УЕ FILA 5; 
-text: 已 编译 程序 的 机 器 代码 。 
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:rodata: 只 读数 据 ,比如 printf ва) T f ОЕ ЭС ( switch) W $0 BJ BERRE НЫ Ы 7.14). 

.data: 已 初始 化 的 全局 已 变 量 。 局 部 和 变量 在 运行 时 被 保存 在 栈 中 ， 既 不 出 现在 .data 节 中 ， 也 
不 出 现在 .bss 节 中 。 

,ss: 未 初始 化 的 全 局 对 变量 ， 在 目标 文件 中 这 个 节 不 占据 实际 的 空间 ， 它 仅仅 是 一 个 占 位 符 。 
日 标 文件 略 式 区 分 初始 化 和 未 补 始 化 变量 是 为 了 空间 效率 ; 在 日 标 文 件 中 ， 林 初始 化 变量 不 需要 占 
据 任 何 实际 的 磁盘 空间 ， 

,Symitab: 一 个 花 和 号 表 (symbol table)， 它 存放 在 程 序 中 被 定义 和 引用 的 函 数 和 全 局 当量 的 信息 。 
一 些 程 序 员 错误 地 认为 必须 通过 -g 选项 来 编译 一 个 程序 ， 得 到 符 导 表 依 息 。 实 际 上 ， 每 个 可 重 定位 
日 标 交 件 在 ,symtab 中 部 有 一 张 符号 表 。 然 而 ， 和 和 编 详 器 中 的 他 号 表 不 同 ，.symtab ОЗУЫ Б) 
Наа Ну Н. 

rel.text: ЕЕЕ А А ЕНЕВ УЛ А ЕН, ел 节 中 的 许多 位 置 前 需要 履 改 。 一 般 
而 言 ， 任 何 调用 外 部 函数 或 者 引用 全 局 变量 的 指令 部 需要 修改 ， 另 一 方面 ， 调 用 本 地 靖 数 的 指令 则 
^s dd. ЕШ, np TRER EM n NDS WES БЕРЕН ЕҢ 
示 链 接 器 包含 这 些 信息 ， 

rel.gata: 被 模块 定义 或 引用 的 任何 全 局 变量 的 信息 .一 般 而 言 ， 任 何 已 补 始 化 全 局 变量 的 初始 
信和 是 全 局 变量 或 者 外 部 定义 其 数 的 地 址 者 希 要 被 修改 。 

,debug: 一 个 调试 符号 表 ， 其 有 些 表 日 是 程序 中 定义 的 局 部 变量 和 类 型 定义 ， 有 些 表 日 是 称 序 中 
定义 和 引 攻 的 全 局 变量 ， 有 些 蚌 原 始 的 忆 源 交 件 。 只 有 以 -g 选项 调用 编译 蓝 动 程序 时 ， 才 会 得 到 这 
35. 

line: ЕСЕН P 4T S Atex 节 中 机 器 指令 之 间 的 喘 射 .只 有 以 -g 选 顺 调用 编译 驱动 程序 
时 ， 才 会 得 到 这 张 表 ， 

Sirtab: Р k, 其 内 容 和 包括 .symtab 和 ,debug АБ, МАЛЫНЫП T 
MW K K E EJ null 结尾 的 字符 囊 序 列 。 

旁 注 ， 为 什么 未 初始 化 的 数据 称 为 .bss? 
用 术语 .bss 来 表示 未 初始 化 的 数据 是 很 普 访 的 。 它 起 过于 IBM 704 汇编 语言 ( 大 的 在 1957 Ф) 


F “RAA (Block Storage Stat)” АНКЕНИ Е, ЕА, ЛЕЕ баа 和 .bss 
节 的 简章 方法 是 把 “bss” 看 成 是 “更 好 地 节省 空间 (Better Save Space )!° 859. 


7.5 НЕТУ 


每 个 可 重 定 位 日 标 愤 块 m 部 有 一 个 符 嫩 表 ， 它 包含 m 所 定义 和 引用 的 符 扩 的 信息 ， 存 链接 器 
的 上 下 文中 ， 有 一 种 不 同 的 符号 ， 

s 由 mm 定义 并 能 被 其 他 模块 引用 的 爹 忆 竺 后 。 全 局 链接 器 符 与 闭 应 十 非 静 态 的 已 ЖАШ АШ 
iv X Ani C HJ static ЖЕР) Б. 

6 由 其 季 模 块 定义 并 被 模块 m 引号 的 金 忆 符号。 这 些 符号 称 为 外 部 符号 (extemal)， 对 应 于 由 
芯 在 其 他 模块 中 的 CC ра НЕШ. 

° 只 被 模块 m 定义 和 引用 的 本 地 符号 。 有 的 本 地 链接 器 符号 对 应 于 带 static 属性 的 C 函数 和 
EMEA. RERS ARH m 中 的 任何 地 方 都 是 可 见 的 ， 但 是 不 能 被 其 他 模块 引用 ,日 标 
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Жї ран THER m 的 节 和 相 虚 的 源 文件 的 名 字 也 能 获得 本 地 符号 。 

认识 到 本 地 链接 矣 特 号 和 本 地 程序 变量 的 不 同 是 很 重要 的 。symtah 中 的 符号 表 不 包 告 对 应 于 本 
地 非 静 太 程序 变量 的 任何 符号 ， 这 些 符号 在 运行 时 在 本 中 被 管理 ， 链 接 跨 对 此 类 符号 不 感光 是。 

有 趣 的 是 , КОНТ C static 帮 性 的 本 地 过 程 变量 是 不 在 栈 中 管理 的 ,取而代之 ,编译 器 在 ,data 
Hibs 中 为 每 个 定 义 分 村 空间， 并 在 符号 表 中 创建 一 个 有 惟一 名 这 的 本 地 通 接 器 着 号 ， 比 如 ， 蛋 设 
ERME HE A fog LT — HB E NIE x 


] int 14) 

2 [ 

J static int x = 0; 
4 return x; 

5 | 

5 

7 int gij 

n | 

3 static int x = 1; 
10 return Xi 

11 | 


在 这 种 情况 中 ,编译 器 在 ,bss 中 为 两 个 整数 分配 空间 ， 井 引出 (export) PE Eo BER 
ORLAR Hom. ETOH х ERAR HAEL BH х2 表示 AEE нех. 
f C HB 9838: HM static ШЕЙШЕ t 2 F | 

CHARRA static b UD ASA ERR ВЕ, ЙЕ Java Ж TT! public 
和 private ВАА, СЕЛА Я Ьа Ё, IET ЖН Ж static Mint bt oaa 
FERREA. Бый, ЕА майс Bh E ғат ka, Толу 
ki). ATEA ишк AA kikpa FER ah АННЫ, 


符号 表 是 由 汇编 器 构造 的 ， TE TAS FE BR HERE IB РГ ЖЕЕ ШЇ. symiub Hiti ELF 
"SW. ЖЕЕ ЖЕ К HX TA BIER. IH 74 展示 了 每 个 表 目 (emry) 的 格式 ， 








cande/fimk/elfstructs.c 
| typedef struct í 
È int name; ~ string table offset */ 
3 int value: (е section offset ar VM address 中 | 
4 Int size; /* object size in bytes */ 
5 char type:4, е data. func, section, or src file name (4 bits) */ 
Б біпділді:і; he local or global (4 hits) */ 
1 char reserved;  /# unused */ 
Б char section; !® section header index, ABS. UNDEF, */ 
9 Ф ar COMMUN */ 
ІП |Р Elf Symbel: 
——MÁ——À caodeTink/elfstructs c 


E74 ELF 符号 表 条 目 
type 10 banding ME 4 0008, 
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name 是 字符 串 表 中 的 字 节 偏 移 ， 指 向 符号 的 以 null БЕКЕН E, value 十 符号 的 地 址 。 
对 于 可 重 定位 舶 模块 来 说 ，value 是 中 定义 由 标的 节 的 起 始 位 置 的 入 移 。 对 寺 可 换行 月 标 文 件 来 说 ， 
该 值 是 一 个 绝对 运行 时 地 址 。size 是 目标 的 大 小 【以 字 节 计算 )。type 通常 要 么 是 数据 , EA, ДЕН. 
符 与 表 还 可 以 包含 各 个 节 的 表 日 ， 以 及 对 应 原始 产 文 件 的 路 径 名 的 表 日 ， 所 以 这 些 口 标的 类 型 也 有 
所 不 同 。Binding 域 表示 符号 是 本 地 的 还 是 全 月 的 。 

每 个 符号 都 和 目标 文件 的 某 个 节 相 关联 ， 由 section ЖЕЛ, 该 域 也 是 一 个 到 节 头 表 的 索引 。 有 
二 外 特殊 的 伪 节 《pseudosection)， 它 们 在 ВУ НЕЯ НЕН Ю: ABS 代表 不 该 被 重 定位 的 符 与 ， 
UNDEF 代表 未 定义 的 符号 《比如 ， 在 本 日 标 模 块 中 引用 ,但 是 却 人 在 其 他 地 方 定 头 的 符 写 )， 向 
COMMON 表示 还 未 被 分 配 位 置 的 林 初 始 化 的 数据 目标 , 对 于 COMMON 5, value 域 给 出 对 齐 请 
求 ， 而 size 给 出 最 小 的 大 小 ， 

К, РШ maino 的 符 与 表 中 的 最 后 个 表 日 ， 通 过 GNU READELF LR gs HX. ЖН 
的 8 个 表 目 没有 显示 出 米 ， 是 链接 器 内 部 使 用 的 本 地 符号 ， 


Num: Value біте Type Bind Ot Мах Hame 
8: Ü 8 OBJECT GLOBAL Q0 3 buf 
9: 0 17 FUNC GLOBAL ü 1 main 
10: Ü 0 NOTYPE GLOBAL 0 UND swap 


在 这 个 例子 中 ， 我 们 看 到 一 个 关于 全 局 符号 buf E Y. Pk H, VAT Даа ТТҚ 
(HH value) 标的 8 字 节 目标。 其 后 跟随 着 的 是 全 局 符号 main 的 定义 ， 它 是 一 个 位 十 .text р h 4838 
为 零 处 的 17 FÉAR. д CERRAR MTS swap 的 引用 。READELF 道 过 一 个 整数 索引 
来 标识 每 个 节 。Ndx=l #л‹лех 节 ， 而 Ndx=3 表示 .data fi. 

相似 地 ， 下 面 是 swap.o АЫФ Н: 


Num: Value Size Туре Bind OL Hdx Name 
B: Q 4 OBJECT GLOBAL 0 3 bufpO 
9: Ü 0 NOTYPE GLOBAL 0 UND but 
10: ) 39 FUNC GLOBAL 7 1 swap 
11: 4 4 OBJECT GLOBAL 0 СОМ bufpl 


目 先 ,我们 看 到 一 个 天 于 全 局 符号 Баро CAKRA, CEM data 中 偏 称 为 零 处 开始 的 一 个 4 
ВОЈ Нк. КУЗ ЖЫ шіре 的 初始 化 代码 中 的 对 外 部 符号 buf 的 引用 。 后 面 紧 随 
的 是 全 局 符号 swap, 它 是 一 个 位 于 .text rn te А ЖАНУ 39 АЛЫ #0. 最 后 一 个 表 日 是 全 局 符号 
bufpl. ЕЕ 个 未 初始 化 的 4 字 节 数据 日 标 〈 要 求 4 字 节 对 齐 ?， 最 终 当 这 个 模块 被 链接 时 它 将 作 
为 一 个 .bss 上 日 标 分 配 。 


练习 是 7.1 
这 个 题目 是 头 于 图 7,1 (b) 中 的 swapo 模块 。 对 于 每 个 在 swapo 中 定义 或 引用 的 符号 ， 请 
НЕА Т Ж swap.o 中 的 .symtab 节 中 有 一 个 符号 表 表 目 。 如 果 是 ， 请 指出 定义 该 符号 的 模 


块 ( swap.0 或 者 main.0 )、 符 号 类 型 ( 本 地 、 全 局 或 者 外 部 】 和 它 在 模块 中 占据 的 节 (лехі. data 
或 者 .bss ). 
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HERRI EHER S HE SERE T SL RI IE LE Tg rH s КҮНӨ O t ohl — TRE 
ЙЕ SOR de. ЖЕЖ He ХЕ ЕНІНЕН roo masl, МӘННІҢ 
TE: ERR AIET TERPEN TEENS АГ TEX. BIERIES OPE ESSEN. UI 
ШЕТАШЕ ЕТУ, ОНЕ. 

不 过 , Е АЕ я ЕЗ ЕВЕ R ЕА КРЕ СЕ 
TEARS) Н, CERWATIUREKRM THEE XH. EH TERES EH. НЕ 
EZERRE., ДЕНИ ИЕГЕ R AWIE R PX aS Bisu, тШ —ЖФ 
Gl, BRTH ӨНЕ ТАЕ. КЕШ, ШЖ ПИКЕ Linux WALSEN КПҮИ 
{+ 


võid Гооіуоій); 


1 
: iat maini) í 

4 fooi}; 

5 rëeturn D; 

Ë ] 

МО А РЕ ТИГ ТА ЕНА Е ir. {Н ЖК ЖЕН foo NHAR. еі 

unix» gcc -Wall -02 -o linkerror linkerror.c 

/tmp/cesz5uti.ó: In function 'main': 

/tmp/ccszb5ut L,Oo(,text«-Ux7T); undefined reference to 'faa' 

collectz: id returned 1 éxit status 

481 5mm emu T. xm esset ЗС РЕЗЕ X. fri. BE 
А cb HAR, кшен ЕМЕ XL Unix 系统 采纳 的 方法 
fud PER. T ER EORR as 2 [ajbi tE, ZR PE UT ERE TRAE RIT EC eb y A LRL. 
$i. x C++ 和 Java ФЕ S NIIT. mangling) 

CHi Java BR fk TA, db ib c vp dome dg. pi фа k. ma 
BEBE #1:% ® ЕҢ Ө) Ж SE | E $W? Сн Java PEETER ah. ЗШЕ 
BAR а а ы Т ЕГ ы ыы iat 
| mangling ), 90 Т ОЧ R ( demangling ), | 

ӚЗЕН, Cede Ima Ж k ERE X, — P Rir ETEd ET ФИИ. 
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Edo Ed ETE. Кк, X Foo 被 编码 成 3Fon， 方 法 被 编码 为 原始 方法 名 ， 辣 面 加 上 __， 加 
上 已 镍 妹 类 的 类 名 ， 再 加 上 每 沾 天 部 的 一 个 字母 ， 比 如 ，Fooc:barlint long) $13 bar _3Fooil. 
SOR ed Ed geh dex Su. 


7.61 链接 器 如 何 解 析 多 处 定义 的 全 局 符号 

在 编 详 时 ， 编 译 器 输出 每 个 全 局 符号 给 汇编 器 ， 或 者 是 强 (strong), HESS (weak), TiL 
编 器 把 这 个 信息 隐 含 地 编码 在 可 重 定位 日 标 文 忻 的 符号 表 里 。 溃 数 和 已 初始 化 的 全 局 变量 是 强 符号 ， 
未 初始 化 的 全 局 变量 是 纶 符号 ,对 于 图 7.1 中 的 示例 程序 , buf. bufp0、main 和 swap 是 强 符号 , bufpl 
RSS s. 

ЕИ M EX. Unix 链接 器 使 用 下 面 的 规则 来 处 理 多 处 定义 的 符号 ， 

« 规则 1: 不 允许 有 多 个 强 符号 。 

s 规则 2， 如 果 有 一 个 强 符 号 和 多 个 弱 符 导 ， 那 么 选择 强 得 号 。 

« 规则 3， 如 果 有 多 个 弱 符 号 ， 那 么 从 这 些 弱 符号 中 任意 选择 一 个 ， 

比如 ， 假 设 我 们 试图 编译 和 链接 下 面 网 个 C 模块 ， 


L {* fool.c */ 1 /* barl.c */ 

2 int mainíj 2 int maini) 

3 | 3 { 

4 return 0; 4 return 9; 
5 } 5 | 


在 这 个 示例 中 ， 链 接 器 将 生成 一 条 错误 信息 ， 因 为 强 符 号 main REMIT ЖК GRN 12: 
unix- gcc Есоі,с barl.c 

ҒЕшр/сса015022.о: In function 'main': 

/tmp/cca015022.0(.Cexc«0x0): multiple definition of 'main' 
/tmp/cca015021.o0(.text-0xQ0): first defined here 

相似 地 , 链接 器 对 于 下 徊 的 模块 也 会 生成 一 条 错误 信息 , 因为 强 符 号 x 被 定义 了 两 次 (规则 1): 


/* fno2.c */ 
int x = 15213; 


/* bar2.c %/ 
int x = 152131; 


void fit 
{ 
} 


{ 


C» іл ap n DR H 


l 

2 

3 

4 int maini) 
5 

ñ rerurn 0: 
j 


} 


ЖҮ, MRE- JURE x AGE Н. MA WIKA РАЈА БЕ OLEI ЧЕНЕ ИЗ 
= GENI2): 


1 {* fo03.c */ 1 /* bar3.c */ 
2 *include «stdio.h- 2 іпЕ x; 

3 void fivoid); 4 

4 4 void ft: 
5 int x = 15213; 5 { 
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ú 6 x = 15212; 
7 int mainí) 1 } 

B i 

9 fi. 

10 printf("x = $&din", x); 

11 return 0; 

12 } 


在 运行 时 , eR х КИЕН 15213 改 为 15212, 这 会 给 main 函数 的 作者 带 来 不 受 欢 迎 的 惊奇 ! 
注意 ， 链 接 器 通常 不 会 表明 它 失 测 到 多 个 x 的 定义 ， 


unix> gcc -o foobarj Есо3.с barj.c 
unix» ./foobar3 


x = 15212 

ШЖ x AATE Ше ЕШШ ONN3. 

1 F food c *®/ 1 Ж barde */ 
2 &include «stdio.h» 2 int x; 

Е void t(void); j 

4 4 void f) 
5 int x; 5 И 

2 Š x = 15212; 
7 int main() 7 ] 

8 l 

9 x = 15213; 

10 fü 

11 printfi"x = $d*n", x); 

12 return 0; 

13 ] 


规则 2 和 规则 3 НАН Е-Е МЕИ ЛЕГЕ. XT FSB PEP ER, RB 
ВНУ, JLHOEUEREMINASISEXXSSANISIBSSSUN. XB FR X F y, Ях ТЕН 
EXA int, TER -MER ENA double. 


1 /* {ооз.с */ 1 І bar5.c */ 
2 Жілсі,де <stdio.h> 2 double x; 
3 void Ílvoid): 3 

4 4 void ЕР) 
5 int x = 15213; 5 { 

Ü int y = 15212; 6 x = -0.0; 
7 7 ) 

8 int maini) 

9 l 

10 Тї); 

11 printf("X = Üx&£x y = (хжҳ Wn", 

12 


х, y); 
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13 return ©; 
14 ү 


在 一 台 ITA32/Linux ТЕ, double 类 型 是 8 个 学 节 ， 俐 int 类 型 是 4 个 字 节 。 因 此 ，bar.c 的 第 
6 行 中 的 赋值 x=-0.0 将 用 负数 的 状 精 嵌 浮 点 表示 纱 盖 存储 器 中 x 和 yy EH RE Сов5с 49335 行 和 
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linux» gcc -o foobar5 foob5.c barb.2 


linux» ./foocbar5 
x = 0х0 y = 0х800000СП 


А-а ДОН, LEGE EO PASA OE), АНА Ға а Ен. MH. 
通常 要 在 程序 执行 很 入 以 后 才 袁 现 出 来 ， 晶 远 启 错误 的 发 生地 。 在 一 个 拥有 上 儿 百 个 模块 的 和 人 型 系统 
中 ， 这 种 类 型 的 错误 相当 难以 履 正 ， 苑 其 因为 许多 程序 员 并 不 知道 链接 器 是 如 柯 工 作 的 。 当 你 怀疑 
有 此 类 错误 时 ， 带 像 GCC-wam-common 这 样 的 选项 调用 链接 器 ， 这 个 选项 告诉 链接 器 ， 在 解析 多 


iE XU ASKS EX. SET E Ene 


£38 72 


жый Р. REFR- DEF KRK £38 S HE HO. i 中 对 符号 x f kl B 5 3858 k P x 的 定 
义 联 系 起 来 。 对 于 下 面 的 每 个 示例 ， 用 这 种 表示 法 来 说 明 链 接 器 将 如 何 解析 每 个 模块 中 的 多 个 定义 
的 符号 如果 有 一 个 链接 时 槽 误 {规则 1}, 输出 “FERROR”, 如果 链接 器 从 定义 中 任意 选择 一 个 【 规 


$| 3), МЕРЕ “UNKNOWN”. 


А. 

/* Module 1 */ 

int maini) 

| 

j 

(а) REF:main.i) --> DEFI 

(b) REF:imain.2) --> DEF í 
B. 


/* Module 1 */ 
void maini} 
i 


} 


(а) ЕЕЕІпаіп,1) --> ПЕЕ I 


ih) REFimain.2) --> ПЕРІ 


/% Module 1 */ 
int x: 
vold mainit 


(а) REFix. 1} --> DEF! 


(б) ЕЕЕ(х.2) --» DEF! 


/* Module 2 */ 
int main; 
int p21) 


/* Module 2 */ 
int main-l; 
int р2 {) 

{ 

} 

) 


o 


/* Module 2 */ 
doubnle xzi.i:; 
int р21) 

d 

} 
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762 ”与 静态 库 链 接 

LTA AAR EREEREER HETH HECER WAAR 
BRATE. ЖЕР, ЖАРАНЫ РИ, Ж ТЯН Ж H RR hi EA А 
独 的 文件 ， 称 为 静态 库 (static library )， 它 也 可 以 用 做 链接 器 的 输入 。 当 链接 右 构 造 “个 输出 的 可 
执行 文件 时 ， 它 只 找 贝 静态 库 电 被 应 用 圳 序 引 用 的 日 标 异 块 。 

为 什么 系统 要 支持 库 的 概念 昵 ” 以 ANSIC 为 例 ， 它 定义 了 一 组 广泛 的 标准 ШО. МЕНІН 
FIRME, ИШ atoi, printf. scanf 和 random, ТИЕ iibe,a 库 中 ， 对 每 个 已 程序 来 说 部 是 可 用 的 。 
ANSI C 还 在 libm.a 库 中 定义 了 一 组 广泛 的 浮 点 算术 函数 ， 例 如 sin. cos 和 sqrt。 

让 我 们 来 看 看 如 果 个 使 用 静态 库 ， 编 译 器 开发 人 员 会 使 用 什么 方法 来 河 用 户 提 供 这 些 明 数 。 一 
种 方法 是 让 编译 器 辨认 出 对 标准 肾 数 的 调用 ， 并 直接 生成 根 应 的 代码 。Pascal， 只 提供 了 一 小 部 分 
ERS. KARRERA. HERATI СВАЕ), Jb C 标准 定 义 了 大 量 的 标 
准 函 数 。 这 种 方法 将 给 编译 器 增加 显著 狗 复 杂 性 ， 而 且 每 次 添加 、 删 除 或 修改 一 个 慰 准 隙 数 时 ， 就 
muse -个 新 的 编译 嚣 版本。 然而， 对 于 庶 用 程序 员 而 言 ， 这 种 方法 会 是 非常 方便 的 ， 因 为 标 惟 请 数 
将 总 古 可 用 的 。 

另 一 种 方法 是 将 所 有 的 标准 C 孙 数 都 放 在 一 个 单独 的 可 重 定位 日 标 异 块 中 
应 用 程序 员 可 以 把 这 个 模块 链接 到 他 们 的 可 执行 文件 中 

unix> gcc main.c /usr/lib/libc.o 

jf ЛАЕШ, I ë a VEG PL ЗЕЙ S b E RC SCA] ЖЖ. HARE D DCRBE HE 
E SUR]. MAU. УМЕ АЕ RED B REBUT X L k Ае 6 — [9 Ex АСЕКЕ ФЕ 
JL, OS t IR] Re НОУ 9 «CE T CBE IS А Е, Hibc.a 大 约 是 8MB, 而 Шипа 大 约 是 IMB. ) 
ЖИЕ, ЕЕЕ ТРН ВАА Е А ВЧ р АРЕ ik e fiks, У EITHER A TS 
АНТ. 5 АШ ла Е, ЖЕКЕ ВА НЧА, ЖӘХЛМ ЕЕЕ À HR GE 
ETEL, Re ”个 非常 耗 时 的 操作 ， 使 得 标准 函数 的 开发 和 维护 变 得 很 复杂 。 

我 们 到 过 为 每 个 标准 函数 创建 一 个 分 离 的 可 重 定 位 文件 ， 把 它们 存放 在 一 个 为 大 家 所 知 的 日 录 
中 来 解决 其 中 的 -- 些 问题 。 然 而 ， 这 种 方法 要 求 应 用 程序 员 显 式 地 链接 合适 的 日 标 模块 到 它们 的 可 
执行 文件 中 ， 这 是 -个 容易 出 错 而 莫 耗 时 的 过 程 : 

unix> gcc main.c /usr/lib/printfí.o /usr/lib/scanf,.o ... 

Bids e ЖЕН Ж. 以 解决 这 些 不 同方 法 的 缺点 。 相 关 的 函数 可 以 被 编译 为 独立 的 日 标 模块 ， 
然后 封装 成 一 个 单独 的 静态 库 文件 。 然 后 ， 应 用 程序 可 以 通过 在 命令 行 上 指定 单独 的 文件 名 字 来 使 


用 这 些 在 库 中 定义 的 函数 。 比 如 ， 使 用 标准 C 库 和 数学 库 中 肯 数 的 程序 可 以 用 形式 如 下 的 命令 行 来 
Ae VETERE: 


unix» gcc main.c /usr/lib/libm.a /usr/lib/libc.a ... 

(ESPECIE, ЖЖЖИ АИИ ЖЕЛЕУ ШЕ B GR, АЙЫ» r BUT kit E Н 
ЕХ 0-58, УШИ ИА S GE SUPBOCUE AE СЕЮ E. СЕЗЕ ДИЕ Ц 
传送 libc.a 给 链接 器 ， 所 以 前 面 提 到 的 对 libe.a 的 引用 是 不 必要 的 )。 

ТЕ Unix 系统 中 ， 静 态 库 以 一 种 称 为 存档 〈archive) 的 特殊 文件 格式 存放 在 磁盘 中 。 存 档 文件 是 
一 组 连接 起 来 的 可 重 定位 日 标 文件 的 集 含 ， 有 -个 头 部 描述 每 个 成 员 日 标 文件 的 大 小 和 位 置 。 存 档 





比如 说 libe,o 中 








474 ЖЕ: 
X ftd En а bi. X ТЇЙ DER RUD ШИЖ ЖНЖ, BERTI E ANH libvectora 的 
静态 库 中 提供 图 7.5 pim Bt eps. 
code/link/addvec.c code/Tlink/multvec.e 
1 vold addveciint *x, int *v, 1 void multvecíint *x, int Ұу, 
2 int *z, int n] 2 int *z, int n) 
3 1 3 { 
4 int 1; 4 int 1; 
5 2 
б for {1 = Ü; l < n: ie) 6 for {i = 0; 1 < n: i++} 
7 2|[1] = xli] + yli]: 7 z[1] = xfi] * yli]; 
8 } 8 ] 
code/link/addyec.c 一 一 code/link/ multvec.c 
(а) addvec.o (b? multvec.o 
7.5 libvector.a ФВ ВЕС 


为 了 创建 该 库 ， 我 们 将 使 用 AR ТН. К: 


unix» gcc -c addvec.c multvec.c 
unix» ar rcs Ilibvector,a addvec.o muitvec.o 


为 了 使 用 这 个 库 ， 我 们 可 以 编写 -个 应 用 ， 比 如 网 7.6 中 的 main.c， 它 调用 addvec БЕЙНЕ CB 
4 Се) 文件 vectorh óE 7 libvectora ӘЛЕМ ЖЕ КЫ). 


/* main2.c */ 
include «stdio.h2 
include "vector.h" 


x[2] 
у{2] = 
2121; 


11, 
3, 


2}; 
4}; 


GR ol] CT 4 н D bd Lp 
H 
еі 
一 


maini] 


= к= Мр 
на 3 

pm Гг" 

- 

ст 


айдуес{х, y, Z, 
printfí"z = 
return 0; 


2) 


i3 p pn 
£m ыз bo 





过 个 程序 调用 了 静态 librectora МЕ P ЕЙ Bog. 


图 7.5 


[$d $dj\n", 2101, 2[1]); 


示例 程序 2 


code/link/mann2.c 


ocode/link/main2.c 


为 了 创建 这 个 可 执行 文件 ， 我 们 将 编译 和 链接 输 六 立 件 main.o 和 lbvectora: 


uñix> gcc -02 -c main.c 


unix» gcc -static -o p2 main2,o ./libvector.a 


图 7.7 概括 了 链接 器 的 行为 。-static 参数 告诉 编译 器 驱动 程序 , 链接 器 应 该 构建 一 个 完全 链接 的 
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可 执行 目标 文件 , 它 可 以 加载 到 存 钳 器 并 运行 , ДТС РЕ Г. MERSE, 
ЖЕ addvec.o 定义 的 addvec 符号 是 被 main.o 引用 的 ， 所 以 它 描 由 айдуес.о 到 可 执行 文件 。 因 为 
程序 不 引用 任何 由 multyec.o 定义 的 符号 , 所 以 链接 器 就 不 会 拷 由 这 个 模块 到 可 执行 文件 。 链接 器 还 
会 从 libc.a Fš B] printf.o ЕЙ, LL AR F£ C 运行 时 系统 中 的 模块 。 

ЖУ талл -с vector.h 


{срр. gel, as) 






libvector.a libc.a Án E 


可 章 定 位 目标 文件 


ргїпїЁ.Ф 


和 其 他 priuf.o 调用 的 模块 
| вишо) | 


完全 链接 的 
可 执行 目标 文件 


图 7.7 与 静态 库 链 接 


763 ”链接 器 如 何 使 用 静态 库 来 解析 引用 
E SEES EE ЖЕН ИТП Н.Ж ЖР LB, 但 是 它们 同时 也 是 程序 员 迷 三 的 源头 , 因为 Unix 链接 
吕 使 用 它们 解析 外 部 引用 的 方式 是 令 人 人 困惑 的 .在 符号 解析 的 阶段 ， 链 接 峰 从 左 冯 右 按照 它们 在 
编译 器 豫 动 程序 命令 行 上 出 现 的 相同 顺序 来 扫描 可 香 定 飞 目 标 文 性 和 存档 文件。 (驱动 程序 自动 将 
命令 行 中 有 所 有 的 .c 文件 翻译 为 ,0 文件 。) 在 这 次 打 描 中 ,链接 器 维持 一 个 可 重 定位 目标 文件 的 集合 
E， 这 个 集合 中 的 交 件 会 被 合 并 起 来 形成 可 执行 文件 ， 和 一 个 未 解析 的 符号 也 就 是 ， 引 用 了 但 是 
尚未 定义 的 符号 ) 集合 U， 以 及 一 个 在 前 面 输入 文件 中 已 定义 的 符号 集合 D。 初 始 地 , B. U #i D 
ig. 
* rag EHJS FA A CPE TD @Ж ЕНЕ f 是 一 个 目标 文件 还 是 一 个 存档 文件 
Ccarchive)。 如 果 f 是 一 -个 日 标 文件 ， 那 么 链接 器 把 了 添加 到 E， 修 改 U 和 了 БВ ЕА 
香 号 定义 和 引用 ， 并 继续 下 一 个 输入 文件 。 
е WR f 是 一 个 存档 文件 ， 那 么 链接 器 就 尝试 焉 配 U 中 未 解析 的 符号 和 由 存档 文件 成 员 定义 
КЕ. ШАЯН АЧСА А m， 定 义 了 一 个 符号 来 解析 U 中 的 一 个 引用 ， 那 么 就 将 m 
加 到 下 中， 并且 链 接 器 修改 U 和 了 来 反映 凸 中 的 符号 定义 和 引用 。 对 存档 文件 中 所 有 的 成 
员 目 标 文件 都 反复 进行 这 个 过 程 ， 直 到 QU 和 了 都 不 再 发 生变 化 。 在 此 时 ， 任 何不 包含 在 卫 
中 的 成 册 目 标 文 件 都 被 至 齐 ， 而 链接 器 将 继续 到 下 一 个 输入 文件 ， 
e 如 果 当 链接 器 完成 对 命令 行 上 输入 文件 的 扫描 后 , U 是 非 空 的 , 那么 链接 器 就 会 输出 一 个 错 
误 并 终止 。 否 则 ， 它 会 合并 和 重 定位 E 中 的 目标 文件 ， 从 而 构建 输出 的 可 执行 文件 ， 
不 壮 的 是 ， 这 种 算法 会 导致 一 些 令 人 困扰 的 链接 时 错误 ， 因 为 命令 行 上 的 库 和 目标 文件 的 顺序 
非 曲 重 要。 如 有 果 人 在 命令 行 中 ， 定 义 一 个 符号 的 库 出 现在 引用 这 个 符号 的 目标 文件 之 前 ， 那 么 引用 就 
不 能 被 和 解析， 链接 会 失败 。 比 如 ， 考 钳 下 面 的 命令 行 发 生 了 址 么 ? 


unix gcc -static ./libvector.a main2,c 
/tmp/ccSXE6Rp.o: In function 'main': 
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/бар/ссЭХНҺЕр.сФ,сехы-0х18): undefined reference to 'addvec' 


在 处 型 libvectora МЇ, U 是 空 的 ， 所 以 没有 libvector.a "P EIER ВУ {=Й ЕН. БШ. 
对 addvec 的 引用 是 绝 不 会 被 解析 的 ， 所 以 链接 路 会 产生 一 条 错误 信息 并 终止 。 

大 十 库 的 一 般 浴 则 是 将 它们 放 在 命令 行 的 结尾 。 如 果 各 个 库 的 成 员 是 相互 独立 的 一 一 也 就 是 说 
没有 成 员 引 用 男 一 个 成 员 定 义 的 符号 一 一 那么 这 些 库 就 可 以 以 任何 顺序 放言 在 命令 行 的 结尾 时 。 

刃 -- 放 面 ， 如 果 库 不 是 相互 独立 的 ， 那 名 它们 必须 排 岸 ， 使 得 对 于 每 个 被 存档 文件 的 成 员外 部 
引用 的 符号 s， 在 命令 行 中 至 少 有 一 个 $ 的 定义 是 在 对 s 的 引用 之 后 的 。 比 如 ， 假 设 foo.e 调用 libx.a 
和 libz.a FRR MRA NE XAH libya 中 的 路 数 ， 那 么 ， 在 命令 行 中 libx.a 和 libz.a 必须 处 在 
liby.a 2 17: 


unix» gcc foo.c libx.a libz.a 11Һу.а 

如 未 再 要 滴 征 依赖 而 求 ， 可 以 在 命令 行 上 重复 库 。 比 如 ， 候 设 fooc 调用 libx.a ТАЙ, iE 
X IBI libya ТАЯ. ПП libya 又 调用 libx.a 中 的 函数 。 那 么 libx.a 必须 在 命令 行 上 重复 出 现 ， 

unix» gcc foo.c libx.a liby.a libx,a 


ЖА CREE. ЗЕГЕ: libx.a 和 liby.a 合并 成 一 个 单独 的 存档 文件 。 


ХІ 7.3 

a йт b Жык ИЛГЕН ЖР ИЯ Ж Kask. ma-bdoFaSUR T b PALAO bx Т 
个 被 3 引用 的 符号 。 RTT SSS, With g err Ode EY CR B kE 
件 和 库 参 元 的 命令 )， 使 得 静态 链接 器 能 解析 所 有 的 符号 引用 ， 

А. р.о ^ libx.a 

B. p.o > libx.a ~ liby.a 

C. p.o ^ libx.a ~ liby.a R liby.a > likx,a > p.o 


77 ЖЕ М 


一 旦 链接 器 完成 了 符号 解析 这 一 步 ， 它 就 把 代码 中 的 每 个 符号 引用 和 确定 的 -个 符号 定义 【也 
号 是 ， 它 的 一 个 输入 目 奈 模块 中 的 一 个 符号 表 表 日 ) 联系 起 来 。 在 此 时 ， 链 接 器 就 知道 它 的 输入 日 
慰 横 其 中 的 代码 节 辑 数 光 他 的 确切 大 小 。 现 在 就 可 以 开始 重 定位 步骤 上， 在 这 个 水 台中， 将 台 并 答 
入 慢 块 ， 并 为 每 个 符号 分 配 和 运行 时 地 直 。 重 定位 由 两 步 组 成 ， 
e 重 定 位 让 和 符号 定义 。 在 这 一 步 中 , 链接 器 将 所 有 相同 类 型 的 节 合 并 为 同一 类 型 的 新 的 聚合 
三 。 手 如 ， 来 日 输入 模块 的 .data 节 被 全 部 合并 成 一 个 节 ， 这 个 节 成 为 输出 的 可 执行 目标 六 
件 的 .data 市。 然 捷 ， 链 接 器 将 运行 对 存储 器 地 址 赋 给 新 的 聚合 节 ， 贱 给 输入 模块 定义 的 每 
个 让， 以 及 贱 给 输入 模 快 定义 的 每 个 符号 。 当 这 一 步 完成 时 ， 程 序 中 的 每 个 指令 和 全 局 恋 
量 帮 有 惟一 鸭 运行 时 存 情 器 地 址 了 。 
e 重 定位 节 中 的 符号 引用 。 在 这 一 步 中 , 链接 器 修改 代码 节 和 数据 节 中 对 每 个 符号 的 引用 ， 梧 
得 它 们 指 周 止 确 的 运行 时 地 址 。 为 了 执行 这 一 步 , 链接 器 依赖 于 称 为 重 定位 表 目 (relocation 
entry) 的 可 重 定位 日 标 模 块 中 的 数据 结构 ， 我 们 接 下 来 将 会 撕 述 这 种 数据 结构 。 
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771 重 定位 表 目 

当 柜 纺 豆 生成 一 个 目标 模块 时 ， 它 并 不 知 着 数据 和 代码 最 终 将 存放 在 存 情 器 中 的 什么 忆 置 。 它 
也 不 知道 这 个 模块 引用 的 任何 外 部 定义 的 函数 或 者 全 局 变量 的 位 置 。 所 以 ， 无 论 何 时 汇编 器 吉 到 灶 
最 终 位 置 末 知 的 且 标 引用 ， 它 就 会 生成 一 个 重 定位 表 目 《relocation entry )， 告 诉 链接 器 在 将 日 标 文 
忻 合 并 成 叮 执行 文件 时 如 何 收 改 这 个 引用 。 民 码 的 重 定位 表 目 放 在 .relo.text 中 ， 已 初始 化 数据 的 重 
定位 表 上 日 旋 在 .relo,data Ф. 

图 7.8 展示 了 ELF 重 定位 表 目 的 格式 。offset 是 需要 被 修改 的 引用 的 节 仿 移 。symbol 标识 被 收 
МЛН ШІЛ. type 告知 链接 路 如 何 自 改 新 的 引用 。 


code/linkzelfstructs.c 


1 typedef struct { 

2 іп, offset; ж offset of the reference to relocate */ 

3 int &ymbol:24, Г symbol the reference should point to */ 
4 сүре:8; /* relocation type */ 

5 р Elf32 Rel; 


code/rtink/elfstructs.e 


4/8 ELF 重 定 位 表 目 
后 个 表 目 表示 一 -个 必须 重 定 位 的 引用 。 


ELF EX f 11 种 不 同 的 重 定 位 类 型 , 有些 相 当 移 秘 , 我 们 只 关心 其 中 两 种 最 基本 的 重 定位 类 型 ; 

e R 386 РС32; 重 定 位 一 个 使 用 有 位 PC 相关 的 地 址 引用 。 回 想 一 下 3.6.3 W, 一 个 PC 相关 
ЮШДЕ ИЕ (PC) 的 当前 运行 时 值 的 偏 移 量 。 当 CPU 执行 使 用 PC 相关 寻 址 的 
指令 时 ， 它 就 将 在 指令 中 编码 的 32 位 值 如 上 PC 的 当前 运行 时 值 ， 得 到 有 效 好 性 【例如 ， 
call 8 13 H bo. PC 值 通常 是 存储 器 中 下 一 条 指令 的 地 址 。 

* R 386 32: Есріу- 32 ЙЕНІ. SE SEXT ФАНЕ, CPU 直接 使 用 在 指令 中 
编码 的 32 位 值 作为 有 效 地 址 ， 不 需要 进一步 修改 。 


7.7.2 ”于 定位 符号 引用 
87.5 展示 了 链接 器 的 重 定位 算法 的 伪 代 码 。 


1 foreach section s 1 

2 foreach relocation entry r { 

3 refptr = s + r.offset; /*ptrioreference to be relocated */ 

4 

5 /* relocate a PC-relative reference */ 

Б if (г.бүре == R 386 PC32) 1 

7 refaddr = ADDRí(S) - r.offset; /*ref'srun-nme address */ 
8 *refptrY = (unsigned) {ADDR ir.symboli + *rafptr - refaddr); 
9 | 

10 

11 /* relocate an absolute reference */ 

12 itf (r.type == R 386 32) 


13 *refptr = (unsigned) (ADDR[r.symbol) + *refptr); 
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14 } 
15 | 


E/9 EENM 

第 11ТЯЇ TAERA ТАНК ТИН АҢА ЕЛЕН г БААТ. RT EBYS B Ik 
Ж. ПЕН Н s 是 一 个 字 节 数组 ， 每 个 重 定位 表 日 了 是 一 个 类 型 为 ЕЇЇЗ2_Ке] Pait, nd 
78 中 的 定义 另外， 我 们 还 假设 当 算 法 这 行 时 ， 链 接 器 已经 为 每 个 竹 和 符号 部 选择 了 运行 时 地 址 
(人 甸 别 用 ADDR(s)#I ADDR(r.symbol) 2. Ж 3 fri ИШЕ Ex or) 4 pul НИН s H 
的 地 址 。 如 果 这 个 引用 使 用 的 是 PC 相关 寻 址 ， 塌 么 它 就 月 第 5 一 9 行 来 重 定位 。 如 果 该 引用 使 用 的 
EA TARL EARTE 11-13 行 来 重 定 位 ， 

重 定 位 PC 相关 的 引用 

ГЕН 71 Ca) 中 的 运行 示例 ，maino 的 text 节 中 的 main ##FF48 H] swap ЖҮЛ, ARTT 
是 在 swapo "ТЕН. PI E call 指令 的 反 汇 编列 表 ， 是 由 GNU OBJDUMP 工具 生成 的 : 


5: е8 tc fi Ef ff call 7 <maln+)x7> омар); 
jí R 388 FCi2 swap relocation entry 


Ма XX. RIE call fS FE T SER 0x6 Ы H ВЕЕ 0xe8 和 随后 的 
32 УІН Oxfrfrfffc 《二进制 4) АЖҚ, EE anak r ТІННЕН. 我 们 还 看 到 下 一 行 显示 的 是 
这 个 引用 的 重 定位 表 日 。( 右 想 -下 ， 重 定 伺 表 日 和 指令 实际 上 是 存放 在 目标 文件 的 不 同 节 中 的 ， 
OBIDUMP 芽 共 为 了 方便 将 它们 显示 在 一 起 .》 午 定位 表 目 rf 出 3 个 域 组 成 : 


r.orfset = 0х7 
r.symbol = swap 
r.tvpe = R 386 PC32 


pulsi КИНЕ ЯНЕ ACTAS T EE Е 0x7 处 的 32 位 PC 相关 引用 ， 使 得 在 运行 时 它 指 回 swap 
权 厅 。 现 入， 假设 链接 器 已 丝 判定 ， 

ADDAS) = ADDR(.text] = ux88ndB83ba 
АП 

ADDR(r.symboi)] = ADDR(swap) = OxB8048?c8, 

(ЕЛІН 7.9 中 的 算法 ， SE BI Hume TEE CR 7 17): 


re[addr ADDR (Si + r.affset 


ÜxBO4E3DÀA4 + СХТ 
1х80483Бр 
然后 ， 它 将 引用 从 当前 值 0-4) EAA 0х9, ЖЕЛЕ dE TRIS swap ЖС CB 8 (12; 


“refptr = [unzigned] (ADDRi(r,symbol) + *refptr - refaddr) 
> iunsigaed) [0x804183c8 + [-4) - Dx8Cc483nDb) 
= (unsigned) (0х9) 


ШУАТ E X FR, cal 指令 有 如 下 的 重 定位 的 形式 ; 
BU483ba: ен 09 05 00 00 call 8D0483cB zswap» swapil; 
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402211 hr, call 指令 将 存放 在 地 址 0x80483ba 处 , 当 CPU 执行 call 指令 时 ,PC КІН 0x80453bf, 
ШЕ ТЕ call 指令 必 后 的 指令 的 地 址 。 为 了 执行 这 条 指令 ，CPU 执行 以 下 的 步骤 : 


1. push FC onto stack 
2, PC «- PC + 0X9 = UxBsÜ4AB3brt + 0х9 = DUx8048323 


BE. EAT RO :条 指令 就 是 swap ВЕРНО — 4365, p m5 ma EE 

你 可 能 想 知 道 为 什么 汇编 器 会 生成 call T8 9 B S LER ЫН 2-4, TCR iC TE S RS 
ЕН, [NA PC 总 是 指向 当前 指令 的 下 一 条 指令 。 在 有 不 同 指 今 大 小 和 编码 方式 的 不 同 的 机 器 上 ， 
ҚАЛЕН ЕН АЕ ІНЕН. ХЕ “个 很 有 用 的 技 芒 ， 它 允许 链接 器 移 明 地 重 定位 引用 ， 
很 壮 运 地 不 用 知道 菜 - - 台 机 器 的 指令 编码 。 

重 定位 绝对 引用 

回想 图 7.1 中 我 们 的 示例 程序 ,swap.o 模块 将 全 局 指针 bufp0 初始 化 为 指 问 全 局 数组 buf 的 第 - - 
个 元 案 的 地 址 ; 

int *hufpo = ébuf[0]:; 


内 为 Биро 起 一 个 已 初始 化 的 数据 有 目标 , Biz t t IR CE B 38 E H pR өзғар.о 的 ,data Tr 
由。 因为 它 被 初始 化 为 一 个 全 局 数组 内 地 址 ， 所 以 它 禹 要 被 重 定位 。 下 和 面 是 swap.o 中 .data 17А RIEC 
S: 

00000000 <butftp0>: 

О: 00 00 OO 00 int *Pufp0 = kbuflDl; 
0: R 386 32 but relocation entry 

我 们 看 到 .data WEA 一个 办 位 引用 ，bufp0 TESTE. ЕЙИЯЛОО. ЖЕТУДЕ НЫЛ — 

个 32 和 位 绝对 引用 ， 开 始 于 偏 移 0 处 ， 世 顷 重 定位 恒 得 它 指向 符号 buf，。 现 在 ， 根 设 链接 器 已 经 判定 


ADDR ir. symbol) = ADDR (buf) = ОхВ049454 
链接 路 使 用 图 7.9 中 算法 的 第 13 行 修改 了 引用 | 


*refptr (unsigned) (ADDR(ír.symbol) + *refptr) 
funsiqned) (Ox8049454 + Ü} 


(unsigned) 10х8П49454) 

ТЕЗ P| h iy H ty Pri, ЗІҢ КЫКЕ: 
0804945c <bufp0>: 

804945: 54 94 04 08 Relocated! 


BMW riz. ЕЕЕ ТЕЧНЕ, ЖЕ Биро 将 放置 在 存储 器 地 址 OxS04945c 处 ， 并 用 被 初始 
化 为 0x8049454,. МЕЖЕ buf 数组 的 运行 时 地 址 ， 


sWap.0 模块 中 的 ,text 节 包 含 5 个 线 对 引用 ， 都 以 相似 的 方式 进行 重 定位 参考 练习 题 712). 
图 7.10 展示 了 最 终 的 可 执行 日 标 文件 中 被 重 定位 的 ,text 和 .data 节 。 


II [| Ч 


code/link/p-exe.d 
1 080483Б4 «main»: 
2 80483р4: 55 push %ерр 
4 804B3b5: 89 es mov *esp,%ebp 


n HU4B3585: 
5 804В ра: 
& ӘСЕРІНЕ! 
7 agáBicl: 
Я 804В1с1; 
4 B0453c4;1 


10 и Жы. 
11 ®й4#1сё; 
12 Оч Зет 


13 ЯЕО4ЯЗСВ 


14 804583cB; 
15 АЕ Е 
16 Büdsicf: 
17 Е049304: 
18 B0483d6: 


15 BD4353G3: 
2D 804933280: 
21 „ДЕ БЕГ 
a š RÜUSS3O4: 
23 B0438385; 
24 B04338b: 
25 80483ed: 
26 MEREN E 


42% 

B3 ec 08 вир 
ей 09 00 00 00 call 
31 EU ХОГ 
B$ ec Ine 
5d pop 
c3 rot 
30 nop 
$0 пор 
90 nop 
Nps! 

35 push 
Hb 15 5c 94 04 DB mov 
al 88 94 04 08 moy 
89 e5 miga 
cT 05 48 965 04 DB 58 тот] 
94 04 UB 

HŠ ас aTr 
Bb ба mma 
89 Da mau 
al 48 95 04 QB mov 
8? DB поту 
за рор 
c) ret 


1 0980494541 <Eufx: 


2 ЕП44454: 


01 


00 010 


3 ПЕр4945с sbufpüs: 


' 0049452: 54 94 04 i 





ir CIE 7,1 0, 


JE 7 了 .4 


В 7.10 


(а) GRECH mu 7 


00 02 00 00 00 


(h) ЕЙ IE daa B 


SUxB,tesp 

J0483c8 cawap» sxwapil: 
Veax,teax 

tebp, tesp 

«ғыр 


tebp 

ÜxBO4945c,tedx Get *hüufpü 
ÜxBO49453, Toax Get bur] ЇЇ 
&esp,*tebp 

s0xB04345B, 0xB04954B8 ішірі = 


&huff! | 


tebp, tesp 

[&edx) , Фасх 

Ұсах, (edx) 

ÜxB049548, ан | Get “ішірі 
kecx, [*eax) 


tebp 
гїйеЛїл&їр-ёхе.„ї 


— pode/link/pdata-exe-d.c 


Reiocared! 


— сомен елй, С 


可 执行 文件 р ЕЕ Лекі 和 .dato 节 


车 题 是 关于 图 了 ,10 中 的 重 走 位 程序 的 。 

А. S TP WL swap HDE X 3| B sr iE REGE BT 

B. 第 5 行 中 对 swap Fr X b | orb lE £ у? 

C. 假设 团 为 某 种 原因 , Mb He E лем Pd & OxB0483bB 处 而 不 是 қылы Ab, Жанр 
War, ЖЗНЕ tes md k A gy? 


ян 48! 


78 可 执行 目标 文件 


我 们 已 经 看 划 链接 右 蚌 如 何 将 多 个 日 标 模 执 合并 成 一 个 可 执行 目标 文件 的 。 我 们 的 忆 榨 序 ， 开 
始 时 是 一 组 ASCII 文本 文件 ， 已 经 被 转化 为 一 个 二 进 制 文件 ， 且 这 个 二 进 制 文件 包含 加 载 程序 到 存 
悄 种 并 运行 它 所 需 的 所 有 信息 ， 图 7.11 概括 了 一 个 典型 的 ELF 可 执行 文件 中 的 各 类 信息 。 


Ü 
Trib SE) v ptt Ў 
иат OO RAR _ 
存储 器 段 Нява сев) 


sasa (HRR 


-一 «лана 
和 调试 信息 
AAHS 
НІ PAR | 


ЕЛІ 上 典型 的 ELF 可 执行 目标 文件 


可 执行 且 标 文件 的 格式 类 似 于 可 重 定 位 目标 文件 的 格式 。ELF 头 部 描述 文件 的 总 体格 式 。 空 还 
包括 程序 的 入 口 点 (entry point)， 也 就 是 当 程序 运行 时 要 执行 的 第 一 条 指令 的 地 址 。.text，.rodata 
Aldata 节 和 可 重 定 位 昌 标 文件 中 的 节 是 相似 的 ,除了 这 些 节 已 经 被 重 定 位 到 它们 最 终 的 运行 时 存储 
器 地 址 以 外 ，.init OE Y -个 小 函 闭 ， 叫 做 _init， 程 序 的 初始 化 代码 会 调用 它 。 因 为 丰 执 行文 件 
是 完全 链接 的 【已 被 重 定位 了 )， 所 以 它 不 再 需要 ,relo t. 

ELF 可 执行 文件 被 设计 为 很 容易 加 载 到 存储 器 ， 连 续 的 可 执行 文件 的 组 块 《chunks) 被 映射 到 
ЖОИЕ. ЕЖ (segment header table) 播 述 了 这 种 映射 关系 。 图 7.12 БІ ИПК AB 
可 执行 文件 p ИНЕ, ЕШ DBJDUMP 显示 的 。 





cade/link/p-exe.d 
Read-oniy code segment 


1 LOAD off Ох00000000 vaddr 0х08048000 paddr 0x08248000 align 2**12 
2 filesz Ox00000448 memsz 0x00000448 flags r-x 
Read/write data segment 


3 LOAD off 0х00000448 vaddr 0x08049448 paddr 0x08049448 align 2**12 
4 tilesz 0х0(00000е8 memsz 0х00000104 flags rw- 
- code/link/p-exe.d 
图 7.12 ИТУ р 6:359 


ІҢ; off: IHRE: vaddr/padár: ЖИЛЕ НЕН, align: 段 对 齐 ， filesz: 目标 交尾 中 的 段 大 小 ，memsz: ТЕКШЕР ТЕ} КАМ: 
flags: 运行 时 许可 。 


从 眉头 表 中 ， 我 们 看 到 会 根据 可 执行 目标 文件 的 内 容 初始 化 两 个 存储 器 段 。 第 1 行 和 第 2 行 告 
诉 我 们 第 一 个 段 〔 代 码 段 》 对 齐 到 一 个 4KB (22) 的 边界 ， 有 读 / 执 行 许可 ， 开 始 于 存储 器 地 址 
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Сма ГКИС Bb, ch Hn frd K 0х448 E M. НЕШ IE жат Hb ЖЕ ОЕ 个 全 
17, ЖТА ELF AM ВЕ Ein. dem 和 .Fodana t. 

第 3 行 和 第 4 ТЕТЕВЕН TRA (КИН) Wx — + АКВ 的 边界 ， 有 读 / 写 许可 ， 开 证 
于 存储 器 地 址 Ox08049448 处 , ТИН АТА (кН FA, ЗЕРЕ ЛА or PUR EF 0x448 处 开始 的 Охев 
TETERE. ТШЕ. (ЕҢ 0x448 ЕТЕ дама ТИЯ. Н ЛЕГЕН ЛҮҮЧҮ РГ BER 
АЕ ES ев 数据 ， 


79 加 载 可 执行 目标 文件 
要 运行 可 执行 目标 京 性 p, ATELE Unix shell Hit {ТР АЛЕН Ж T: 


unix» „р 

因为 不 是 一 个 内 置 的 shell iñ, BEEL shell 会 认为 IE— T TT Hes ЖР, ЯЛАН 
AER dr ERR Р REO EA (loader) ВЕНЕ ЕВА Е RU Tie d. FEIN Unix BUT pnr Ens 
GR] execve ВАЕ ЦА RIDERE. ИПИЕ 8.46 Жр ТЕНИ НЕЙ МАШ. ШИ ar flr НІ > 
Кер ЖЯНЕ as SE АГ. ЖИН НЕГЕ 1 ЖІЕ?. HIA v5 (entry 
point, WEITET. iE TETTE L B| TF RE SEX Ir ИШАНИ BU, (loading). 

每 个 Unix БЯЯЫН-ЗЕННІНЕНЕНЕ, ШШ 7.03 所 示 。 在 Linux ЕЙ, АВЕ А, 
地 址 0x(8048000 处 开始 ， 数 据 段 是 在 接 下 来 的 下 一 个 AKB 对 齐 的 地 址 处 。 жїгї ШЕ FO RU ie! 
写 段 之 后 的 第 一 个 4KB 对 齐 的 地 址 处 ， 并 通过 调用 malloc 库 往 上 增长 1 我们 将 在 109 节 中 详细 描 
М: malloc Ri.) БЕРЕ Ox40000000 站 的 凤 是 为 共享 库 保 留 的 ， 膨 户 乒 总 是 从 地 址 ОЪ 
钼 开始 ， 基 向 下 史 长 的 【向 低 存 赃 器 地 址 证 向 增长 3。 从 栈 的 上 部 开始 于 地 址 0xe0000000 SEDE Pe E 
АЧ ЖЕЛЕ ЛИИ ШШ Cir PURO i em ene ERES. 
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当 如 载 器 运行 时 ， 它 创建 如 图 ?7.13 КИЛЕНЕ ЕШ. Ап УЗЕ SEHR F, IUE, 
器 将 可 执行 文件 的 相关 内 容 找 贝 到 代码 和 数据 段 。 接 下 来 ， 加 载 器 跳 转 到 程序 的 入 口 点 ， 也 就 是 符 
Ly start 的 地 址 ,在 _start 地 址 处 的 后 动 代 码 Cstartup code) 是 在 日 标 文件 соо "Pg X, ТІНІН 
C 程序 都 是 一 样 的 。 图 7.14 展示 了 启动 由 码 中 特殊 的 调用 序列 。 在 从 ,text 和 .init ТН / ЖИЙ. 
例 程 后 ， 县 动 代码 请 用 atexit 例 程 ， 这 个 程序 附加 了 一 系列 在 应 用 调用 exit 函数 时 应 该 谢 用 的 程序 。 
exit 图 数 运行 atexit 注册 的 所 数 ， 然 后 通过 调用 _exit 将 控制 返 思 给 操作 系统 。 接 着 ， 启 动 代 码 调用 
应 用 程序 的 main 程 床 ， 这 就 开始 执行 我 们 的 全 代码 了 。 在 应 用 程序 返回 之 后 ， 启 动 民 码 调用 _exit 
程序 ， 尼 将 控制 返回 给 操作 系统 。 


1 0х080480с0 e start»: /* entry point in text */ 

2 call _libc_init_ first [є startup code in .text */ 

3 call init i* startup code m mt */ 

1 call atexit {* startup code in .text */ 

2 call main /* application main routine */ 
6 call exit I* returns control to OS */ 

7 Ре control never reaches here */ 


4714 dí Ср сонда к 
注意 ， лана ЖЫН Аже КШ. 


$t. MERERANNAL? 

FUSE T ak: At ЖАЛДА, en ЖАЛАЛ ЕВА, ЭТЕ Sk FE e MT ILE 
қ, ob ea aa. SERA Ed ЛИЕ MCA, АЛЖ. ESUL E RE 
SEER 1030s ede. AUD modo SHE, ЖЖЖ borne epe th. 

对 于 不 够 有 再 心 的 读者 ， 下 面 是 关于 加 载 实 际 是 如 合 工 作 的 一 个 概述 : Unix 系统 中 的 每 个 程序 者 
运行 在 一 个 进程 上 下 文中 , 这 个 进 程 上 下 文 有 自己 的 夸 拟 地 址 空间 . 当 shelli£fr—4- 42/58. 5C shell 
进程 生成 一 个 子 进 程 , 它 是 父 进程 的 一 小 复 制品 . 子 进程 通过 gxecve 系统 调用 启动 加 载 器 。 加 载 器 拥 
除 子 进程 已 有 的 虚拟 存储 器 身 ， 并 创建 一 组 新 的 代码 、 鼓 据 、 准 和 栈 段 ， 新 的 栈 和 堆 段 被 初 妈 化 为 罕 . 
通过 将 虚拟 地 址 室 间 中 的 页 映 碳 到 可 执行 文件 的 页 大 小 的 姐 块 {chunks ) 新 的 代码 和 数据 段 被 初始 化 
为 可 抗 行文 件 的 内 容 。 和 最后， 加载 器 跳 转 到 _start 地 址 ， 它 最终 会 调用 应 用 的 main ӨШ. ВТ — 3: 
部 信息 ， 在 加 载 过程 中 没有 任何 从 磁盘 到 存储 医 的 孝 据 措 见 。 直 到 CPU 引用 一 小 被 映射 的 虚拟 页 ， 
TERAH., ың, ЖЖЕНЯЛЕНЕ ЗАЛЫН ЕЛ ШАЯАЯРЯЯАЯ. 


练习 题 7.5 

A. 为 什么 每 个 已 程序 都 需要 一 个 叫做 main 60 d? 

B. ЖМ ЖТ ДА C 的 main 函 教 可 以 通过 调用 exit 或 者 执行 一 条 return 语 自 ,或 者 两 者 都 不 做 ， 
硬 程 序 仍然 可 以 正确 终止 吗 ? Ж. 


7.10 动态 链接 共享 库 
我 们 在 7.6.2 节 中 研究 的 静态 库 针 对 的 许多 尊 题 是 应 用 程序 如 何 使 用 太 量 可 用 的 相关 冰 数 。 铭 
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їй, КЁЛ ДЖ 18 КК. ӘЛ a КЕЕ, ms HERON S. WDRIVHIA 
译员 想 要 司 用 一 个 库 的 最 新 版 本 ， 他 们 必 织 以 革 种 方式 了 解 到 该 库 的 更 新 情况 ， 然 后 显 趟 地 将 凶 们 
的 程序 与 新 的 库 重 新 链接 。 

另 一 个 问题 是 几乎 每 个 C 程序 都 使 用 标准 VO 函数 ， 比 如 printf 和 scanf. ЈАЛТИ, ХЕ 
的 懂 码 会 被 复制 到 每 个 运行 进程 的 文本 段 中 。 在 一 个 运行 0 一 100 个 进程 的 典型 系统 上 ， 这 会 是 对 
稀少 的 存 情 器 系统 资源 的 极 大 浪费 ，( E -个 有 趣 属 性 就 是 不 论 CT ESEDU SE KIA s 
它 总 是 一 种 稀有 的 资源 。 磁 盘 空 间 和 厨房 的 垃圾 桶 同样 有 这 种 篇 性 。) 

ЖЕЖ (shared library) 是 禾 力 于 解决 静态 库 缺 陷 的 一 个 秽 代 创新 产物 。 共 至 库 是 ТП 
抉 ， 在 运行 对， 可 以 加 载 腹 任意 的 存储 器 地 址 ， 并 在 存储 器 中 和 一 个 程序 链接 起 来 。 这 个 过 程 称 为 
动态 链接 (dynamic linking)， 是 由 一 个 叫做 动态 链接 器 Cdynamic linker) 的 程序 来 执行 的 ， 

此 享 库 也 称 为 共享 目标 (shared object), Æ Unix 系统 中 通常 用 .so RAREN. ШКЕ 
СЕНІ TIETE AO DLL СОН ЕЕ). 

AFER “Аз” CACARA TE. Bb. Ж {ШИ ЕШ ХАЙ, Р ЕЛЯ 
个 .so X. fF. ТИЗЕР n HATH ЖЇК SA зо 文件 中 的 代码 和 数据 ， 而 不 是 像 静 态 库 的 
НАЛ АН АЗЫНА р ЕФ. ЖҚ, ЯНА, 一 个 共享 库 的 .text BR 
УІ ЖТА МЫН ТИЕ А A 10 ЕТЕ 2 EU ЯН ФЕН ЯНДА 
ЖҮНІ. 

图 7.15 ЖЕ Г 7.6 中 办 例 程 厅 的 动态 链接 过 程 。 为 了 构造 图 7,5 ТЕШЕ ИЕН 
[F libvector.so， 我 们 会 调用 编译 器 ， 给 链接 器 如 下 特殊 指 今 ; 

unix» gcc -shared -fPIC -o libvector.so addvec.c multvec.c 


mairz.c veckor.h 





ЖТ 15 
‚Срр,сє1],ав!) libe, ga 
lihvector,.ac 
[Ж it НИЖЕ mainz.o 重 定位 和 
Н = B 


Sir BL 


可 执行 日 标 交 半 P 


та 
(ехегсув) libc.so 
libvector.sac 


asa 
fra rH së £ 


BARES T Ki 
8715 “用 共享 库 来 动态 链接 
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-fPIC 选项 指示 编译 器 生成 与 位 置 无 关 的 代码 下 - - 节 将 详细 讨论 这 个 问题 )。-shared 选项 指示 
链接 器 创建 一 个 共享 的 目标 文件 。 

一 旦 我 们 创建 了 这 个 库 ， 我 们 随后 就 要 将 它 链接 到 图 7.6 的 示例 程序 中 。 

unix> gcc -0 p2 main2.c ./libvector.so 

XX HERES T — Tr nj ur H ЖЕНЕ ро, ПШ ЖЕНЕШЕ K IB ЕНЕТІН АГ RI libvectorso SE 
接 。 基 本 的 思路 是 当 创 建 可 技 行文 件 时 ， 静 态 执行 一 些 链接 ， 然 后 在 程序 如 载 时 ， 动 态 完成 链接 

认识 到 这 一 点 是 很 重要 的 ， 在 此 时 刻 ， 没有 任何 libvector.so 的 代码 和 数据 节 被 真 的 捞 由 到 可 执 
行文 件 了 2 中。 取而代之 的 是 ， 链 接 器 拷贝 了 一 些 重 定位 和 符号 表 信 息 ， 它 们 使 得 运行 时 可 以 解析 对 
HWHbveciorso 中 代码 和 数据 的 引用 。 

当 加 载 器 加 载 和 运行 可 执行 文件 p2 时 ， 它 利用 7.9 节 中 讨论 过 的 技术 ， 加 载 部 分 链接 的 可 执行 
文件 р2. 接着 ， 它 注意 到 p2 包含 一 个 ,interp 节 ， 这 个 节 和 包含 动态 链接 器 的 路 径 名 ， 动 太 链 接 器 本 
身 就 是 一 个 共享 日 标 〈 比 如 ， 在 Linux 系统 上 的 LD-LINUX.SO)。 加 裁 器 不 再 像 它 通常 那样 将 控制 
传 违 给 庶 用 ， 取 而 代 之 的 是 加 载 和 运行 这 个 动态 链接 路 。 

然后 ， 动 态 甸 接 器 通过 执行 下面 的 重 定位 完成 链接 任务 : 

. 重 定 位 libe.so 的 文本 和 数据 到 某 个 存储 器 段 。 在 IA327Linux 系统 中 ， 共 享 库 被 加 载 到 从 地 

ДЕ 0x40000000 开始 的 区 域 中 参见 图 7.13). 

* EEI libyectorso 的 文本 和 数据 到 另 一 个 存储 器 段 。 

е Hed. p2 中 所 有 对 由 libc.so 41 libvectorso 定 冯 的 符 马 的 引用 ， 

最 后 ， 动 态 链接 骂 将 控制 忧 弟 给 应 用 程序 。 从 这 个 时 刻 开 始 ， 共 享 库 的 位 置 就 固定 了 ， 半 日 在 
程序 执行 的 过程 中 都 不 会 改变 ， 
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到 此 刻 为 止 ， 我 们 已 经 讨论 了 在 应 用 程序 执行 之 前 ， 旭 应 用 程序 被 加 载 时 ， 动 态 链接 器 加 载 和 
链接 共享 库 的 情景 。 然 而 ， 应 用 程序 还 可 能 在 它 运 行 时 要 求 动态 链接 器 加 载 和 链接 任意 共享 库 ， 而 
无 需 在 编译 时 链接 屠 些 库 到 应 用 中 。 

动态 链接 是 一 项 强大 有 用 的 技术 ， 下面 基 一 些 现实 世界 中 的 例子 ， 

e 分 发 软件 。 微软 Windows 应 用 的 开发 者 常常 利用 共享 库 来 分 发 软 性 更 新 。 他 们 生成 一 个 共 
享 库 的 莉 版 本 ， 然 后 用 户 可 以 下 载 ， 并 用 它 蕉 代 当 前 的 版 本 。 下 一 次 他 们 运行 应 用 程序 时 ， 
应 用 将 自动 链接 和 加 载 新 的 共享 库 ， 

. 和 构建 高 性 能 WEh 服务 器 。 许多 Web 服务 器 生成 动态 内 容 ， 比 如 个 性 化 的 Web ШШ. Кл 
额 和 广告 标语 。 早 期 的 Web 服务 器 通过 使 用 fork 和 execve 创建 一 个 子 进 程 ， 并 在 该 子 进程 
的 上 下 文中 运行 CGI 程序， 来 生成 动态 内 容 。 然 而 ， 现 代 高 性 能 的 Web 服务 器 可 以 使 用 基 
于 动态 链接 的 更 有 效 和 完善 的 方法 来 生成 动态 内 容 。 

其 思路 是 将 生成 动态 内 容 的 每 个 函数 打包 在 共享 库 中 。 当 一 个 来 自 Web 浏览 器 的 请 求 
到 达 时 ,服务 器 动态 地 加 载 和 轿 接 适当 的 函数 , 然后 直接 调用 它 , 而 不 是 使 用 fork 和 ехесуе 
在 于 进 相 的 上 下 文中 运行 焕 数 。 图 数 会 一 直 缓 存在 服务 器 的 地 址 空间 中 ， 所 以 只 要 一 个 简 
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ВР А ШЕШИНЕ БАКИ РЕЛЕ Ж Т. 这 村 -个 繁忙 蕉 网 站 来 说 是 有 很 大 影响 的 ， 
宙 进 一 步 ， 林 以 在 运行 时 ， 无 客 停 让 了 服务器， 更 新 已 疗 在 的 函数 ， 以 及 添加 新 的 峡 数 。 
% Linux 和 Solaris 这 样 的 Unix 系统 ， 为 动态 链接 器 提供 ” -个 简单 的 接口 ， 允 许 应 用 程序 在 
КЇТ! ШЦ ЛЕНЕ ЛЕ. 


tinclude «alfcen.h- 


void *dlopeníconst char *filename, int flag); 


ib fb ЖАЛ АЯНЫ ё] e) ЯН. ЖІ Null. 


dlopen 少数 加载 和 链接 共 时 地 flename。 用 以 前 带 RTLD, GLOBAL 选项 打 并 的 库 解 析 filename 
中 的 外 部 符 三 ,如 果 当 前 可 执行 交 忻 是 带 -rdynamie ЛЕН, ЖАУ ЕН, ERU T RET 
号 也 是 可 用 的 .flag 参数 必 须要 各 包括 RETLD_NOW, 访 标志 告诉 链接 器 立即 解析 对 外 部 竺 号 的 引用 ， 
£2 BJE ЕТІП LAZY 标志 ， 访 标志 指 小 链接 器 推迟 符 导 解析 直到 执行 来 日 库 中 的 伐 妈 时 。 延 两 全 
ire EX ^ fln] ELI RTLD GLOBAL ББ. 


l;nciude «dlfcn.h- 


void *dlsymivoid *handle, char *symbol); 


iu); EASA AES ES REA, ЖШ Null. 


disym KARWA Е р АТАТ СЕП CES PERO RARE CPP To MRR SAE., 
ДЕАШ РАВ ЦЕ, ТЗ NULL. 


Kinciude «difcn.h- 





int dlclose tvoid *handle!: 





返 国 : 若 成 功 则 为 0， 若 出 错 则 为 1， 
如 果 没 有 其 他 基 革 库 还 在 使 用 这 个 共 芋 库 ，dlelose ТЕН iw tia FE. 
#include «dlifzn.h- 


const char *dierror tivold): 


{ЙТ}: 如 果 前 面 对 doper. dlsym 或 dlelose 的 调用 失败 ， 
则 为 错误 消息 ， 如 果 前 面 的 调用 成 功 ， 则 为 Null, 





dlerrer RGR AERE, ERAR EAH Фореп. disym 或 者 dlclose 通 数 时 发 生 的 最 近 的 
iux. ШЖ 8 АМЕ, ын Е] NULL. 

f 7.16 展示 了 我 们 如 何 利 用 这 个 接口 动态 链接 我 们 的 libvectorso ЖЕ (F 7.50, 然后 调用 它 
РЈ addvec ЕҢ. РХ ВЕР, ЖТ АКЕН ЖИЕНІ ОСС: 


unix> gcc -rdynamic -O2 -o p3 main3.c -lidi 


н оройн с 


1  ginclude estiio.h-» 
2 Жіпсішде «dlicn.h» 
3 
4 


int x[2] = (1, 21; 
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5 лп y[2] = (3, ар 
6 int z[2]; 
7 
H 


int maini) 
3 1 
1G void *handle; 
11 void (*addvec)iint *, int *, int *, int): 
12 Char *error; 
13 
14 I* dynamically load the shared library that contains addvec() */ 
15 handle = dlopení("./libvector.so"', RILD LAZY]: 
16 if i!handle) | 
17 fprintfí(stderr, "*s'n", dlerrorí))]: 
18 exitiil; 
19 } 
20 
21 i* теа pointer to the addvec() function we Just loaded */ 
22 addvec = dlsym(handle, "addvec*); 
23 if [terror = clerrori)) != NULL) Í 
24 fprintfistdierr, "%5\п", error); 
25 exittll: 
26 } 
КЛ 
28 Ж Now we can call addvec() just like any other function */ 
29 addvec(x, y, z, 2); 
30 ргігіні"? = [Фа %а]х\п", z[0], z[11); 
31 
32 /* unload the shared library %/ 
33 i£ (dlclose(han3le) < 0) (í 
34 fprintfistderr, "Фп", dlerrori)); 
35 exitíli; 
36 | 
17 return J; 
38 ] 





сойдет. c 
4716 一 个 动态 加 载 和 链接 共享 库 jibvector.so 的 应 用 程序 
XGi. AREH Java ЖИЕП | 
Java 定 头 了 一 个 标准 调用 规则 ， 叫 做 Java 本 地 接口 (Java Native Interface, ЛИ), % Ait Java 
程序 谓 用 “本 地 的 " СӘС, INIM AREE GE CEA CC 函数， 比如 说 Гоо, ЕЗИ ЖА, 


比如 说 foo.so. 当 一 个 正在 话 行 的 Java ЖЕ ДЕШЕ JUR АШ foo 时 ,Java HAAA diopen 接口 (或 
省 某 个 类 似 于 此 的 东西 ) 动态 链接 和 加 载 озо, HUS ER foo, 


712 “与 位 置 无 关 的 代码 (РІС) 
共事 库 的 一 个 主要 日 的 就 是 允许 过 个 正在 运 行 的 进程 共享 存储 器 中 相同 的 库 伐 码 ， 因 而 节约 宝 
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HEFER AR: HA. ФОН ДЕШИ Дз -AERA ЕЛЕДЕ? 一 种 方法 是 给 每 个 共享 
库 分 也 一 个 事先 预备 的 专用 的 地 址 空间 组 块 (chunk), 然后 要 求 加 载 器 总 是 在 这 个 地 址 加 载 共 膏 闫 。 
虽然 这 补 方 法 很 简单 ， 但 是 它 也 着 成 了 一 些 严 重 的 问题 。 首 先 ， 它 对 地 址 空间 的 使 用 效率 不 卓 ， 因 
为 上 使 一 个 进 召 不 使 用 这 个 库 ， 那 部 分 空间 还 是 会 被 分 配 出 来 。 第 二 ， 它 也 难以 管理 。 我 们 将 不 得 
不 保证 没有 组 块 会 重 倒 。 每 次 尖 一 个 库 修 疏 了 之 后 ， 我 们 必须 确认 它 的 已 分 配 的 组 块 还 寺 合 它 的 大 
小 。 如 时 不 适合 了 ， 我 们 必须 找 一 个 新 的 组 块 。 并 有 日， 如 果 我 们 创建 了 个 新 的 库 ， 我 们 还 必须 为 
尼 寻 找 罕 间 。 随 着 时 间 的 进展 ， 很 没 在 一 个 系统 中 有 了 成 百 个 库 和 各 种 版 本 的 库 ， 就 很 准 避 免 地 址 
НЕ АЕМ. ЖЕП ЛА АЛЧА, REESE. XAR. MESI 
БЕРІЛ ЕЛЕР, дЫ ТОН £ АЭЭ НЕ ШИЙ, 

“НДІ ЛЕ ТЕНЕ TOM. TER A ЖЕНЕ ИЛЕ ЧИ, Жїл ТЕЕ ЖЕДЕП ЯНА 
p HARE, ЛЕНЦ Б š € Ж, X bq E (position-independent code, РІС). HIP ССС 使 用 
PIC 选项 指 GNU 编 详 系统 生成 РІС Ч. 

在 一 个 IA32 系统 中 ， 寻 同一 个 是 标 模 块 中 过 程 的 调用 是 不 震 要 特殊 处 理 的 ， 因 为 引用 是 PC 相 
МЧ, Си, MOCE PIC 了 《参见 练习 题 7.4)。 然 而 ， 对 外 部 定义 的 过 程 调用 和 对 全 局 变 
量 的 引用 通 单 不 是 PIC， 因 为 它们 部 要 求 在 链接 时 重 定位 。 


7.12.1 PIC 数据 引用 

编译 器 通过 运用 以 下 有趣 的 事实 来 乍 成 对 全 局 赛 量 的 PIC 引用 : 无论 我 们 在 存 情 器 中 的 何 处 加 
载 一 个 日 标 模 块 (包括 共享 日 标 模 块 )， 数 据 段 总 是 分 本 为 紧 随 在 代码 段 后 面 。 央 此 ,代码 段 中 任何 
指令 和 机 数据 段 中 任何 变量 之 间 的 距 高 都 是 个 运行 时 常量 ， 与 代码 上段 和 数据 段 的 绝对 存 赃 器 位 置 是 
ERE- 

为 了 运用 这 个 事实 , 编译 器 在 数据 段 开 始 的 地 方 创建 了 一 个 表 , IU fio y b EA (global offset 
table, GOT). СОТ 包含 矢 个 被 这 个 日 标 模块 引用 的 全 局 数据 日 标的 表 日 。 编译 器 还 为 GOT 中 每 个 
表 曲 生成 个 重 定位 记录 。 在 加 载 时 ， 动 态 链接 器 会 重 定位 СОТ 中 的 每 个 表 日 ， 使 得 空 包 含 正确 
的 绝对 地 址 。 每 个 引用 全 局 数据 的 目标 模块 都 有 ЕА Сот. 

亚运 行 时 ， 司 用 下 面 的 代码 形式 ， 通 过 GOT 间接 地 引用 每 个 全 局 变量 


call Ll 

11: popi *ebx; # ebx contains the current PC 
addi SVAROFF, %еһх # ebx points to the СОТ entry for var 
movl (ЖеБх), Зеах # reference indirect through the GOT 


movl {%еёеах], %еах 


在 这 段 代 码 中 ， 对 LI 的 调用 将 返回 地 址 【正好 就 是 popl 指令 的 地 址 } ЖАН. МНЕ, рор! 
指令 把 这 个 地 址 弹出 到 %ebx 中 。 这 两 条 指令 的 最 终 效果 是 将 PC BE 5 ЖЕҢЕ Феһх H, 

指令 addl 给 %ebx 增加 -个 常量 偏 称 量 ， 司 得 它 指 向 СОТ 中 适当 的 表 目 ， 该 表 月 包含 数据 项 
的 绝对 地 址 。 此 时 , 就 可 以 通过 包含 在 %ebx FI СОТ 表 目 间接 地 引用 全 局 变量 了 。 在 这 个 示例 中 ， 
Ж mol 指令 《间接 地 通过 СОТ) 加 载 全 局 变量 的 内 容 到 寄存 器 %eax 中 。 

PIC 代码 有 性 能 缺陷 。 现 在 每 个 全 局 变量 引用 需要 五 条 指令 而 不 是 一 条 ， 还 需要 一 个 额外 的 对 
СОТ 的 和 存 情 器 引用 。 而 且 ，PIC 代码 还 要 用 一 个 额外 的 寄存 器 来 保持 СОТ 表 目 的 地 址 。 在 具有 大 
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ЖЛ ИДЕ, S A-O KER. 然而， 在 寄存 器 供应 不 足 的 IA32 系统 中 ， 即 使 失掉 一 
АМЕН 7А Я НЕ Н Р. 


7122 PIC 函数 调用 
PIC 代码 当然 可 以 用 相同 的 方法 来 解析 外 部 过 程 调用 : 


call 11 

Ll: popl %ebx; # ebx contains the current PC 
addl £PROCOFF, &ebx # ерх points to СОТ entry for proc 
call *[%еһх) # call indirect through the GOT 


不 过 ， 这 种 方法 对 等 一 个 运行 时 过 程 调用 都 要 求 三 条 额外 的 指令 。 取 而 代 之 ，ELF 编译 系统 使 
HPA RRR, AER RE (lazy binding}， 将 过 程 地址 的 饰 定 推 进 到 第 一 次 调用 该 过 程 对 。 
第 一 次 调用 过 程 的 运行 时 开销 很 大 ， 但 是 其 后 的 每 次 调用 都 只 会 花费 一 条 指令 和 - ' 个 间接 的 存 情 器 
引用 。 

延迟 绑 定 是 通过 两 个 数据 结构 之 间 简 尘 但 又 有 些 复 杂 的 交互 来 实现 的 ， 这 上 师 个 数据 结构 是 ， 
СОТ 和 PLT (procedure linkage tables， 过 程 链接 表 )。 如 果 一 个 目标 模块 调用 定义 在 共享 库 中 的 任何 
KA, MAERA ACE GOT 和 PLT. GOT 是 .data 节 的 一 部 分 ，PLT 是 .text 节 的 一 部 分 。 

图 7.17 展示 了 图 7.6 中 示例 程序 main.o 的 СОТ 的 格式 。 头 三 条 GOT & HEHE: GOTO] 
包含 .dynamic 段 的 地 址 ， 这 个 段 包 含 了 动态 链接 器 用 来 绑 定 过 程 地 址 的 信息 ， 比 如 符号 表 的 位 置 和 重 
定位 信息 ，GOT[H 包 含 一 些 定 叉 这 个 模块 的 信息 ; GOTI2] 包 含 动态 链接 器 的 延迟 绑 定 代码 的 入口 点 。 


08049674 9804960 1 dynamic 节 的 地 址 
08049678 4000a9f | 链接 器 的 标识 信息 


0804967с 40005901: | МЕТА СА 
08049680 0804845а | PLTU] push! 地 址 《printf 
08040684 08048468 | PLT[2]PP pushi 地 址 (addvec) 





8.7 可 执行 文件 P2 的 全 局 偏 移 量 表 (СОТ) 
ВН? МВ 7.6, 


XE X (FM: НЕН maino 调用 的 每 个 过 程 在 GOT 中 都 会 有 一 个 表 目 ,从 GOTI3] 表 日 开 始 。 
对 于 示例 程序 ， 我 们 给 出 了 printf 和 addvec 的 СОТ 表 目 ，printf 定义 在 libe.so 中 ， 而 addvec 定义 
在 libvector.so "T, 

图 7.18 展示 了 我 们 示例 程序 p2 的 PLT. РТ 是 一 个 16 字 节 表 目 的 数组 。 第 一 个 表 目 PLTIO] 
É— P "TARCRH, CA ASAR. ЕРТЕНИНЕ PLT hab AH. А PLII] 
Жаз. ТЕКИН, PLTU SERT printft，PLTI2] 对 应 于 addvec. 

PLT [0] 

18048444; ff 35 78 96 04 OB pushl 0x8049678 # push &GOT[1]/ 

80484442: ІІ 25 Ус 96 04 08 imp *0xB04967C # jmp to *GOT[2](linker) 


8048450: 00 00 # padding 


490) #7% 
8048452: 00 00 ë padding 


PLT[1] sprints 

HÜ4Bd54á: EL 25 80 95 Dá 28 упр “Пх804926580 # Jmp ғо *GOT[31] 
804845a;: 58 00 DO DD 00 pushl 50х0 ID for printf 
S04845E: е9 сой ІР ff ff jmp 8048444 # jmp to PLTIA] 


H 


PLT[2] <аддуес> 

3048464; ІТ 25 84 95 Па 08 jmp %09х8049684 # jump to %00Т14) 
HiáBsS46a: EB 08 00 09 00 pushl $0х8 ID for addvec 
8048461: 29 do £f ff ff jp 8048444 # Jmp to РТО} 


Ric 


ә<соклег БІЛ entriez» 


?ЛВ 可 执行 交 件 Pz 的 PLT 
Nip Cad ЫР 7,5 RUE 7.6, 


WIR. НАЛАРЫ ЕН НАТ, XE printf f addvec ЖЛЕ ЕЕ pv d ISI) РІЛ 
RITAR -条 指令 上 。 比 站 ， 对 addvec 的 调用 有 如 下 形式 ; 

düdB5bb: eB ad £e TF fl call 8048464 «addvec- 

1 аййуес $ AEWA. EERS PLT[2] 的 第 一 条 指令 ， 访 指令 通过 GOT[AHA T — 7 [8] 
ЕН. ЯЛАН, ET GOT 表 日 包含 相应 的 PLT 表 目 中 pushi #0 ИНИН. ВТ, РІТЛІМІНІЕ 
路 技 仪 侈 是 将 控制 转移 回 到 PLT[2] 中 的 下 条 指令 。 这 条 指令 将 addvee 符号 的 ID ЖКА Т. ЖЕ 
一 条 指令 跳 转 到 PLT[0], M GOTILH 中 将 另外 一 个 标识 信息 的 字 压 入 栈 中 ， 然 后 通过 GOTE 
ДЕ ВЕЗЕ ан. БЕЖЕН И ТШ ЕН ЖЕ addvec 的 位 置 ， 用 这 个 地 址 覆盖 GOT[4), Л] 
把 控制 传递 给 addvec. 

一 次 在 程序 中 请 用 addvec 不， 控制 像 前 耐 一样 传递 给 PLT[2]。 不 过 这 次 通过 GOTI4] 的 间接 
БЕН RF BI k АТ addvec。 从 此 刻 起 ， 惟 一 额外 的 开销 就 是 对 间接 跳 转 的 存储 器 引用 。 


743 处 理 目标 文件 的 工具 


ТЕ Unix 系统 中 有 大 量 可 用 的 工具 可 以 帮助 你 理解 和 处 理 日 标 文件 。 特 曾 地 ，GNU binutils # JE 
ATEM. m Hon EAXT4ES Unix 平台 上 。 

“ AR: GER SE, HA. ЖЕ, ЈН mR N. 

* STRINGS; ЯШ T Ki РАТА Pf IT EIB S. 

+ STRIP: 从 用 祭文 件 中 删除 符号 表 依 息 ， 

. NM: 列 出 一 个 日 标 妆 件 的 符号 表 中 定义 的 符号 ， 

е SIZE: ЯШ НА Р ИН ТАК. 

e READELF; Жл НУ АЗЕ, БЕ ELF ЫНДА. (ü SIZE M 
NM FRE. 

° OBJDUMP: 所 有 有 二进制 [- 具 之 母 ， 能 够 显示 一 个 日 标 文件 中 所 有 的 信息 。 它 最 有 用 的 蕊 能 
ж БС лехі 节 中 的 一 进 制 指令 ， 
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Unix 系统 为 操作 共享 库 还 提供 了 ldd 程序 : 
. ldd， 列 出 - -个 可 执行 文件 在 运行 时 所 需要 的 共 至 库 。 


7.14 小结 


链接 可 以 在 编译 时 由 静态 编 详 器 来 完成 ， 也 可以 在 加 载 时 和 运行 时 庄 动态 链接 器 来 完成 。 链 接 
器 处 理 称 为 目标 文件 的 一 进 制 文件 ， 它 有 二 种 不 同 的 形式 : 可 重 定位 的 、 可 执行 的 和 闪 学 的。 亲征 
定位 的 日 标 祷 件 由 静态 链接 器 组 合成 -个 可 执行 的 目标 立 件 ， 它 可 以 加 载 色 存 情 器 中 并 执行 。 共 亨 
日 标 文件 《共享 详 》 是 在 运行 时 由 动态 链接 峰 链 接 和 加 载 的 ， 或 者 隐 含 地 在 调用 程序 被 加 载 和 开始 
执行 时 ， 或 者 根据 逢 要 在 程序 调用 dopen FERA. 

链接 器 的 股 个 主要 任务 是 符号 解析 和 和 重 定位 。 符 号 解析 将 目标 交 件 中 的 每 个 全 局 符号 部 绑 定 到 
“Е -的 定义 ， 和 侧重 定位 确定 每 个 符号 的 最 终 存 入 器 地 址 ， 并 稀疏 对 于 些 目标 的 引用 ， 

静 老 链接 器 是 出 像 GCC 这 样 的 编译 器 调 周 的 。 它 们 将 多 个 可 重 定 倍 日 标 文件 组 合成 一 个 单独 
的 可 执行 日 标 文件。 多 个 日 标 交 件 可 以 定义 相同 钢 符 号 ， 而 链 绪 器 用 来 悄悄 地 解析 这 些 多 处 定义 的 
规则 可 能 在 用 户 程 序 上 书 引入 的 微妙 错误 。 

多 个 日 标 文 丫 可 以 获 连 接 到 一 个 单独 的 静 坊 库 中 。 链 接 器 有 几 库 来 解析 上 其 他 目标 模 鼎 中 的 符号 引 
用 。 许 多 链接 器 通过 从 去 到 右 的 顺序 扫描 来 解析 符号 引用 ， 这 是 另 -个 引起 令 人 述 感 的 链接 时 错误 
的 米 源 ， 

加 载 器 将 可 执行 交 件 的 内 容 映 射 到 存储 器 ， 并 运行 这 个 程序 。 链 接 器 还 可 能 生成 冲 分 链接 的 可 
执行 目标 文件 ， 这 样 的 交 件 中 有 未 解析 的 到 定 头 在 共享 库 中 的 程序 和 数据 的 引用 。 在 加 载 时 ， 加 载 
侣 将 部 分 链接 的 可 执行 文件 映射 到 存储 器 ， 然 后 调用 动态 链接 器 ， 它 通过 如 载 共 导 库 和 重 定位 程序 
中 的 引用 来 完成 链接 任务 ， 

被 编 详 为 位 置 无 关 代 治 的 基 上 学 麻 可 以 加 载 到 仔 休 地方， 也 本 以 在 运行 时 被 多 个 进程 共 享 。 为 了 
加载、 链接 和 访问 上 共计 库 的 函数 和 数据 ， 府 用 程序 还 可 以 在 运行 时 使 用 动态 链接 器 ， 


参考 文献 说 明 

在 计算 机 系统 文献 中 并 没有 很 好 她 记录 链接 。 因 为 链接 是 妙 在 编 详 器 、 计 算 机 体系 结构 和 操作 
系统 的 变 叉 具 上 上 ， 它 要 求 理解 代码 生成 、 机 器 语言 编 称 、 程 序 实 哆 化 和 虚拟 存储 器 。 它 恰好 不 落 在 
菜 个 通 间 的 计算 机 和 标 统 专业 中 ， 因 此 这 些 领 域 的 经 典 立 献 并 没有 纺 好 地 描述 它 。 然 而 ，Levine 的 专 
车 提供 了 有 关 这 个 主题 的 很 好 的 - “ 般 性 参考 资料 [47}。[35] 描 述 了 ELF 和 DWARF 的 原始 规范 
(对 .debug 和 .line 人 内 容 的 规范 说 明 )。 

围绕 二 进 制 翻译 〈binayy translation) 的 概念 有 一 些 有 趣 的 研究 和 商业 活动 ， 二 进 制 翻译 包括 1] 
标 文 件 内 容 的 语法 解析 、 分 析 和 修改 ， 二 进 制 翻译 有 三 个 不 同 的 上 岂 的 [46]， 在 一 个 系统 上 模拟 另 - 
个 系统 ， 观 察 程 序 行为 ， 或 是 执行 不 能 在 运行 时 执行 的 与 系统 相关 的 优化 。 drm. Wn 
VTune. Purify 和 BoundsChecker， 用 二 进 制 翻译 来 为 程序 员 提供 对 他 们 程序 的 详细 的 观察 。 

Atom 系统 提出 了- -个 灵活 的 机 制 ， 能 为 Alpha 可 执行 日 标 广 件 和 共 学 库 提供 任意 的 C в. 
Atom 被 用 来 创建 无 数 种 分 机 工具 ， 包 括 跟踪 过 程 调用 、 前 析 指 令 计 数 和 存储 器 引用 模式 、 模 拟 存 
储 颖 系统 行为 ， 以 用 隔离 存储 器 引用 错误 。Btich[66] 和 EEL[46] 在 不 同 的 平台 上 上 提供 了 估 臻 相似 的 荔 
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ЯЕ. Shade 系统 利用 二 进 制 翻译 实现 指令 剖析 [15]。Dynamo[2] 和 Dyninst[8] 提 供 了 一 些 机 制 ， 能 在 
运行 时 为 存储 器 中 的 可 执行 文件 提供 测试 和 优化 。 Smith 和 他 的 同事 们 致 为 于 研究 程序 剖析 和 优化 
ЭЖИ УР [91]. 


ЖЕТЕМ 
76 % 
AE КЩ swap.c 函数 ， 它 计算 自己 被 调用 的 次 数 ， 
1 extern int РЁ ||: 
2 
3 Int *hufpO0 = sbut[0]; 
4 static int *bufkr1l; 
^ 
Б static void `ncri) 
F l 
8 static int count=0; 
9 
10 COUNt+t+: 
1l  j 
12 
13 void swapt() 
là { 
15 int temp; 
16 
17 incri): 
18 bufpl = &buf[1]; 
19 -emp = *butpu; 
20 *bufpü = *bufpl: 
21 *bufpl - temp; 
22 0) 


对 于 每 个 swap.o "Pg 515. An RUE {ЕЕ swap.o 的 ,symtab ПН Н ЕЖЕН, W 
指出 。 如 果 是 这 样 ， 请 指出 定义 该 符号 的 模块 (swap.o 或 main.oy， 符 号 类型 (本 地 、 全 局 域外 部 ) 
ШАТ р ВЕ (лехі. „дага 2X bss?. 


mwl | T | ` 
ә» ү LLL 
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77 € 

不 改变 任何 变量 和 名字 ,修改 746.1 小 节 的 hars.e， 使 得 foos.c ШхЖУ 的 正确 值 ( 也 就 是 整数 
15213 和 15212 的 十 六 进 制 表示 )。 

78 € 

在 此 题 中 , REF(x,i) - -> DEFC, k) 表 示 链 接 器 将 任意 对 模块 i 中 符号 x 的 引用 与 模块 & 中 符号 x 
的 定义 相关 联 。 在 下 面 每 个 例子 中 ， 果 这 种 符号 来 涪 明 链接 器 是 如 何 解析 对 在 每 个 模块 中 有 才 个 定 
义 的 引用 的 。 妹 果 出 现 链 接 时 错误 (规则 1)， 输 出 “ERROR”。 如 果 链 搂 器 从 定义 中 性 意 选 择 一 个 ， 
那么 输出 “UNKNOWN”. 


А. 


/* Module 1 */ 
int maini) 

{ 

} 


/* Module 2 */ 
static int main-l; 
int p21) 

i 


} 
(а) REF(main.1) --> ТЕРІ 0] 
(b) REF(main.2) --> DEF( _ | 
B. 
/* Module 1 */ /* Module 2 */ 
int X; double x; 
void maini) int р21) 


i 
) 


(а) КЕЕ{Х.1) --> DEFI 
(b) REF(x.2) 


х Module 1 */ 
int x-1; 

void maini, 

| 

} 


(а) БЕРІж.2) 
ру) ЕВЕЕ{х.2) 


79 € 
考虑 下 面 的 程序 ， 它 白 两 个 日 标 模块 组 成 ， 


1 
2 
3 
4 


/* foob.c */ 
void p2(voidi!; 


int maini) 


--> DEFI 


--» СЕРІ 
--» DEF! 


{ 
) 


) 


— 


/* Module 2 */ 
double х-1.0; 
int p21} 
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printfi"Oxg£x*n", maini; 


Ü l 

Š p2í(l; 

7 return 9; 
8 } 

1 /* barb,c */ 
2 Жіпсіпіев <stdio.h> 
3 

á char nain; 

5 

Б void p2í) 

1 { 

8 

4 


) 

HF Linux KACARITA RFR, ШЫҰ p 不 初始 化 变量 main, НЕТЕТ 
"Ox55w" HEEF. DRBEBEROX— НІШ? 

710 9 

a Hl b xs BIER НА Hi S НЕГЕ. IU amb 表示 a KHT b, EREM аң T 1 
b 定义 的 符号 ， 对 于 下 面 的 每 个 场景 ， 给 出 使 得 静态 链接 器 能 够 解析 所 有 符号 引用 的 最 小 的 命令 行 
(也 就 是 ， 售 有 最 少数 量 的 日 标 文件 和 库 参 数 的 命令 )， 

А.р.о > libx.a > p.o. 


B.p.o — liox.a ~ liby.aandliby.a 一 libx.a. 
C p.o — li»x.a ~ liby.a > libz.a andliby.a — libx.à — libz.a. 


711 € 

图 7.12 中 的 段 头 吉明 数据 段 占 用 了 存储 器 中 0х104 个 字 节 。 然 而 ， 只 有 开始 的 0xe8 ЧЕЛГЕН 
中 执行 文件 的 节 。 是 什么 引起 了 这 种 差异 ? 

7.12 %% 

图 7.10 中 的 swap ҒЫ 5 个 重 定位 的 引用 。 对 于 每 个 重 定位 的 引用 ， 给 出 它 在 图 7.10 中 的 
条 与 、 尼 的 起 行 时 存储 器 地 址 和 它 的 从 。swap.o 模块 书 的 原始 代 和 友和 重 定位 表 目 如 图 7.19 所 示 。 


图 7.10 中 的 行 号 





1 00000000 «Swap»: 

2 0: 55 push tebp 

3 1: Bb 15 00 00 O0 00 mov 0х0,%ейх get "bufnÜü- &bufTO] 
3 3: Қ 386, 52 bufpÜ relocation entry 

3 


7: al 04 00 00 00 шоу 0х4, %еах get buff 1j 


TRAE 
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б 8: R_386_32 buf relocation entry 
7 c: B9 eb ШОУ tesp,tobp 

B e: c7 05 00 00 00 00 04 тоу! SOx4, 0x0 bufpi = «ІШІҢ; 
9 15: CO 00 00 

10 10: R.38E 32 bufpl relecation entry 
11 14; Қ 38E 32 buf relocation entry 


12 18: 89 ec mov %ерр,%евр 


13 18: 8Ь ба mov (&edx) ,Фесх temp = БО]; 
14 1с: 89 02 mov %вах, {%едх) buf[0]1=bufl 1]; 
15 le: 21 00 00 00 00 mov 0х0,%еах get *bufpl=&buff1] 
16 1f: R_23B6 32 pufpl relocation entry 
17 23: 89 ПБ mov Фасх, (Жеах) bufl 1 ]-iemp; 
18 2b: Ed pop Зарр 
19 26: cÀ ret 
4719 5218 7.12 的 代码 和 重 定 位 表 目 
713 999 


考虑 图 720 中 的 & 代码 和 相应 的 可 重 定位 目标 模块 。 
А. 确定 当 模 决 被 重 定位 时 ,链接 器 将 收 改 .text 中 的 哪些 指令 . 对 与 每 条 这 样 的 指令 ， 列 出 科 的 
重 定位 表 旧 中 的 信息 ;， 节 候 移 、 重 定位 类 型 和 符 与 名 子 。 
B. 确定 当 模 块 被 重 定 位 时 ， 链 接 器 将 修改 .data 中 的 哪些 数据 日 标 。 对 于 每 条 这 样 的 指令 ， 列 
1 它 的 重 定位 表征 中 的 信息 ， 节 偏 称 、 重 定位 类 型 和 符号 包子 。 
nf 以 随便 使 用 诸如 OBJDUMP 2 35) LAGER BE АН ІСТЕН. 
extern int p3ívoid); 
int x = 1; 


int *xp = kx; 


1 

2 

j 

4 

5 void p2(inb y) { 
à } 

- 

Н 

3 


vold plil { 
р2{*хр + D31)); 
JD |) 
(a) СЩ 
1 90000000 <р2>: 
2 О: 55 push $ebp 
3 1: 89 e5 ШОУ $esp,tebp 
4 3: 89 ес Tov $ebp,t*tesp 


496 


5 5: 5d 

б 6: СЗ 

7 00000008 «pls: 
1 8: 55 

5 9: 89 е5 

10 b: 63 ec 08 


11 e: 8j c4 14 

12 11: ея fo ff ft ff 
13 16: 89 cz 

]4 18: al Чо ор бй CO 
-5 id: 03 10 

L6 1#: 52 


ret 


+ ebp 


tebg 
$esp,tebp 
S0x8B,t*esp 
SÜxfftftifd,tesp 
12 <рі-оха> 
teax,tedx 
Uxü,€$e6ax 
(*&eax),' жедік 
$edx 

#1 <р1+\х19> 
%ерр, %еѕр 
$ebp 


Lb? np EAH br X TERT text 市 


13 27; 5а 

20 28: g3 

L ü6n000000 zx»: 

à 0; 01 00 DJ QU 
3 000000904 <хр>: 

4 4: 00 20 GO GOD 


(c? B| E$ H bes X TH] data T 


图 7.20 


7.14 999 


ЖЕҢ 721 85 САО BR] PER GEI LEER GR 


练习 题 7.13 的 示例 代码 


A. ЗЕ АУЫ, 链接 器 将 修改 .text 中 的 哪些 指令 。 对 于 每 条 这 样 的 指令 ， 列 出 它 的 


ЕЛМЕНЕН ИЯ; Timm. ЖУН ET 


B. 确定 当 横 氛 被 重 定位 时 ， 链 接 器 将 修改 rodata 中 的 哪些 数据 。 对 才 每 条 这 样 的 指令 ， 列 出 它 


的 惠 定 位 表 目 中 的 舍 县 ， 节 仿 移 、 重 定位 类 型 和 符号 名 学 。 


可 以 随便 使 用 说 为 OBJDUMP 之 类 的 | 有 具 来 帮助 你 解答 这 个 是 日 。 


int relo3íint vzl) 1 
switch [vali (| 
case 100; 

returníval»; 
case lüi: 


returní(valsl?): 


— v їл dm ім bh») ë e 


саве lUi: cage 104: 


d returnival«i); 
3 сазе 105: 

10 returmnivals3); 
11 default; 

12 returnivals$): 
13 ] 

14  ] 

1 000080000 <reloj3>: 

2 0: 55 

3 1: 89 еб 

4 3: 8b 45 08 

5 5: 84 50 9с 

5 9: B3 Га 05 

7 Ci 77 1? 

d е: ff 24 95 00 O2 00 00 
9 15: 40 

19 16: eb 10 

11 18: 83 cú 33 

12 1b: eb 05 

13 14: 8d 76 00 

l4 20: 83 с0 05 

15 23; eb 03 

16 25: 83 сб 06 

17 28: 89 ес 

18 2а: bd 

19 2р: с3 ret 


7.15 %%% 


链接 


(a) СТЕ 


push 

mov 
mov 
lea 
сїр 
ja 
jmp 
inc 
Јр 
ааа 
jnp 
lea 
add 
jmp 
add 
mov 


рор 


ћерр 

tesp,tebp 
ÜxBHi*ebp),£$eax 
OxffffftS9citeax),tedx 
S0x5, Фейх 

25 <те1о3+0х2 |> 
*0хС{, Фейх, 4} 
teax 

28 «reloj40x28- 
SÜUx3, Жеах 

28 «reloisUx28- 
Ох (жеѕі) , езі 
5 0х5, Феах 

id «reloàis0üx28» 
30х6, %еах 
$ebp,tesp 

%ерр 


(b) d sg НУ А де 节 
1 This is the jump table for the switch statement 


2 0000 58000000 15000000 25000000 28000002 4 words at offsets 0x0 0x4, 0х8, and Oxe 
3 0010 18000000 20000900 


2 words at offsets 0х10 and 0х14 


(e) АГ# {2 HPR RI тойма 节 
图 7.21 ЖЫ 7.14 的 示例 代码 


完成 下 面 的 任务 将 帮助 你 更 熟悉 处 型 日 标 文件 的 各 种 工具 ， 
А. ЕА E. libe 和 jibm.a 的 版 本 中 包含 多 少 目标 文件 ? 
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B. gcc -02 产生 的 可 执行 代码 与 gee -02 -g 产生 的 不 同 吗 ? 
C. (LIRE EE LL, GCC 坚 动 程序 使 用 的 是 什么 长 享 库 ? 


练习 题 管 案 


练习 题 7.1 EX 
这 道 练习 是 的 日 的 是 帮助 你 理解 链接 器 符号 和 СЫЛ ЕУ Н Ж. ТЕС 的 本 地 变量 
temp 915169. 


Der] а [аш | seo pm 
ыы «эш | mas [х= 
| а omma мее [х=] 
pee | m [| - | 一 _ 
练习 题 7.2 答案 
这 是 СТЕНД, ЖКА] Unix 链接 器 解 析 定 义 在 一 个 以 上 模块 口 的 全 局 符号 时 及 使 用 规 
则 的 理解 。 理 解 这 些 规则 可 以 帮助 你 避免 … 些 讨厌 的 编程 错误 。 
А. 链接 器 选择 定义 在 模块 | 中 的 强 符号 ， 而 小 是 定义 在 模块 2 中 的 入 符号 《规则 2): 

(а) REF(mair.l) --» DEF {main.1) 

(b) REF(main.2] --» DEF(main.l) 
B. 这 是 一 个 错误 ， 因 为 每 个 模块 都 定义 了 一 个 强 符号 man GAN 1), 
C. НЕ ЖЕ ХЛЕБ 2 中 的 蝇 竺 号 ， 而 不 是 定义 在 模块 1 PHRAS GAU 2): 


(а) БЕЕ{х.1} --» БЕҒіх,23 
(h) REF(x.2) --> DEFIx.2) 


练习 题 7.3 答案 

在 前 令 行 中 钳 误 地 放置 藤 态 库 的 谷 置 是 造成 令 许多 程序 员 迷 惑 的 链接 器 错误 的 应 丸 原 因 , 然 而 ， 
一 卫 你 理解 了 链接 器 是 如 何 使 用 静态 库 来 解析 引用 的 ， 它 就 相当 简单 易 情 了 。 这 个 小 练习 检查 了 你 
ЖАУМЕН: 

А.асс p.o libx.a 


B.gcc p.o libx.a liby.a 
C. gce p.o libx.a liby.a libx.a 


t 5188 7.4 答案 

XA E UY НЕН 7.10 中 的 反 汇 编列 表 。 在 此 ， FUR H BE Ы ККУ INTE U AR PER. 21% 
ЖМ PC 相关 寻 址 的 理解 。 

А. 第 5 行 被 重 定位 引用 的 十 六 进 制 地 址 为 0x80483bh. 

B. 第 5 行 被 重 定位 引用 的 十 六 进 制 值 为 0x9g。 记 住 ， 反 汇编 列表 给 出 了 小 端 法 字 节 上 顺序 表示 的 
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51918. 
C. 这 里 的 关键 观察 点 是 无 论 链接 器 将 .text ЕТЕНЕ А, HAA swap eA [EL ЕКШЕ E HE 
Bj. 因此, 无 论 链 接 器 将 .text 节 定 位 在 何 处 ,因为 引用 是 一 个 PC 相关 地 址 , 所 以 它 的 值 都 将 是 0х9. 


练习 题 7.5 答案 

Л а, CHEFS d GV Rs E. Xx e EE E T Noi asp 
的 理解 .你 可 以 一 考 图 7.14 HA C НЫН ЖІН Чр: 

A. 每 个 程序 都 需要 一 个 main ЖЖ, ЧАС АЛПА Т TC 程序 而 言 部 是 相同 的 ,要 跳 
转 到 一 个 别 收 main HAR E. 

B. ШЖ main 以 return 语 富 终止 ,那么 控制 忧 违 回 启动 程序 ， 访 程序 通过 调用 _exit Е 
НЕМЕ АЙ. ШЖШГ ЖЮ f return 语句 , 也 会 发 生 相 同 的 情况 。 如果 main 是 以 调用 exit ££ IET]. 
那么 exit 将 最 终 通 过 调用 _exit 将 控制 返回 给 操作 系统 。 在 所 有 三 种 情况 中 ， 最终 效 果 是 相同 的 ， 当 
main 完成 上 时， 控制 会 返回 给 操作 系统 。 
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502 第 B 章 


从 绽 处 理 器 加 电 开 始 ， 直 到 你 断 电 为 目 ， 程 序 计数 器 收 设 一 个 友人 列 的 慎 
бі, Еу д. 

其 中 ， 每 个 a д ТОНА д ВУНЕ, EHEM а, ЇЇ а, 的 过 渡 称 为 控制 转移 (control 
transfer). IX FLA ES PEEL PEE EIE SL (low of control BY control flow). 

ЕНЕ ЖЧ ЫЕ — T “ ҮШ RAN EPET АҺАРА, РТВ (memory) HA Et 
М. ЖЗШ, РОЗЕ, mue ngl nnm. ЕНЕМЕ. Т Кир — tb 
ЖЫШ F dE S ST E AB {НЕЗ ІІ ТЕЛ НСАУ АЙНУР ИНК ЖИП IER PCR HB КОЛУ. 
ҖЕТЕ МЕНІН. 

{Н ж: ЖЕ, УА НЕЛЯ) Ж ETRAS EL ARCA AE ЕО А W ШЕН ШКАТ. 
ЇЙ Et p Е ЕННАТІН X. ЕШ, МЕЕ ЕА ОН) 会 定期 产生 信和 号， 这 个 事 
{Б БДИ. BLf О Ж IS. DLE {НИ Р; TEE E KANG. АПАК. 
АЗА ЖӨНІ MA: АҒАНЫ, OERE ГЕМЕ НЫ И ТВ. 

Ж FC OR SE АМЕ Fe Ж” ЖЖ ROSE x Ee Wi АМ ПП т. ГН А ЕСЕ 
(exceptional control flow, AFRA). ЕСЕ ЖЕЛІНЕ АҒЫН ЕМЕН. Еш, AAE, i 
Tr REIN US] SUPE e И ы АЕНМЕНЕНЕН. ОТАНЫ, ЖЕМЕ КЕН 
从 一 个 用 只 进 种 转移 怨 另 一 个 用 已 进程 。 企 度 用 屋 ， 一 个 进程 可 以 发 送 МЕКЕН — TER, ІП 
接收 者 会 将 控制 突然 转移 到 它 的 МЕКЕННЕН. “个 程序 可 以 通过 回 走 通常 的 栈 规则 ， 并 执行 
$i EL pL ТЕМЕН АРЫ ЖАНИ ти RU МАҒ. 

作为 程序 员 ， 理 解 ECF 对 你 们 来 说 很 草 装 ， 这 有 很 多 原因 

+ 理解 ECF 将 带 助 你 理解 重要 的 系统 概念 . ECF 是 操作 系统 用 来 实现 lO. ЖЕЛ И ТИЛЕ 

ЖЖЖ» ЖӨИ Аш ЕНСІН, ӘЛІНІҢ ЕСЕ. 

. 理解 ECF JE ЕК У Н] E ed S HE UE B 5. FETU SERE H — ШИ 
BL (trap) sk ЖЖ] (system call) Ё) ЕСЕ, МЕН. КШ. ПАБ 
Ж. ЖЮ ИҢ, ОЕ ТИЙЕ, ИЛЕ MEDERE, ДЕЛ ЛЛУ ИШЛЕРДЕ Я 
НІЛ ЖЕСІН. BERE ke x BJ ЖИН ЛИН НАН XC UU it ЕЛАНА tan py HI Н. 

4 理解 ECF 3446554 5R ЕЛ RGR ЕД. РАЖ ЛУНИН f o X85 ЕСЕ 机 制 ， 
HEUEA UE. ЖЕШИН L. ЙІН ИЕ НЕ ЖИЕ, VO MI HI Sr ix b 
事件 。 如 果 你 理解 这 具 ЕСЕ ВИ, 35A f LEER ЕЯ З Й Unix shell 和 Web 服务 器 
Z AS SP F Т. 

б 理解 ECF 将 帮助 你 理解 软 位 异常 如 何 工 作 。 粤 СЫН Java 这 样 的 语言 通过 try, catch AA 

throw zn KERRI Ro HU. SKCE ROS ЛИТ ЕНТІҢ ТІЗЕ ЖЗНЕ СЕ, 15 ROB 
Wi HA HR ERR SERE wr ru. FERR R. PAH ЕСЕ, ñ: C phig 
setjmp 5I! longimp РА $ 32 PERT , ЕТЕНЕ РА SU ЖШН ia SUC НЕН n f СД ЗЕ. 

f HA d. МЕЗ АФ кё ТУН] RE RISE ug. XX тр ш IET RAE 
Tre 2) AR Ju HJ ДЕШ EB ER F H BU. ЕЕЕ, potu n ЕШ ЕСЕ 的。 我们 描述 存 
在 于 个 计算 机 系统 中 所 有 后 次 上 的 各 种 形式 的 ECF。 我 们 从 异常 开始 ， 异 常 位 于 健 件 和 操作 系统 
交界 的 部 分 。 我 们 还 会 讨论 系统 调用 ， 它 们 是 为 席 几 程序 提供 到 井 作 系统 的 入 口 点 的 异常 。 然 后 ， 
我 们 会 提升 抽象 的 屋 次 ， 擂 述 进程 和 信和 号， 它们 位 十 应 用 和 操作 系统 的 交 盎 之 处 。 最 后 ， 我们 将 讨 
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论 非 本 地 踏 转 ， 这 是 ECF lf PREX. 


8.1 异常 


异常 是 一 种 形式 的 异常 控制 流 ， 它 一 部 分 是 由 硬件 实现 的 ， 一 部 分 是 由 操作 系统 实现 的 。 因 为 
它们 有 部 分 是 由 硬件 实现 的 ， 所 以 具体 细节 将 随 系 统 的 不 同 而 有 所 不 同 。 然而， 对 于 每 个 系统 而 
тт, 基本 购 思 想 都 是 相间 的 。 (Ел ТЛУ Н ВОЗЕТЕ АЯР Е ЗЕ И CREER TE. 
并 且 帮 助 消除 现代 计算 机 系统 的 一 个 经 常 令 人 感到 迷 感 的 方面 。 

З (exception) 就 是 控制 流 中 的 突变 ， 用 来 响应 处 理 器 状态 中 的 某 些 变 化 。 图 8.1 展示 了 基 
Жү) M. 


W Н FEET РАН 


ҢІ B А кіш ы 
к 
处 理 








FF Ж 
《可 选 的 ， 


图 8.1 RRRA 


处 理 其 状态 中 的 一 个 变化 (事件 ) 般 丰 了 从 应 用 程序 到 一 个 异常 企 理 程序 的 帘 发 的 控制 转移 【 -个 异常 )， 在 竺 常 尾 理 程序 完 
成 处 理 后 ， 它 将 控制 返回 给 被 中 断 的 程序 或 者 终止 。 


EKAT, МАНАТ ЗЕРЕН, WRR FERATE ҰНЫН Lus ЖЖ 
тар, АША ЛУН ИУ RHS О. 。 状 态 变化 被 称 为 事 千 〈eventy， 事 件 可 能 和 当前 指令 的 热 
行 自 楼 相关 。 比 如 ， 发 生 卡 拟 存 储 器 缺 页 、 算 术 溢 出 ， 域 者 -条 指令 试图 除 以 零 。 另 -方面 ， 囊 性 
可 能 和 妆 朋 指令 的 执行 没有 关系 。 比 如 ， 一 个 系统 定时 器 户 生 信号 或 者 - -个 UO 请 求 完成 。 

在 任何 情况 中 ， 当 处 理 器 检测 到 有 事件 发 生 时 ， 它 就 会 通过 一 张 叫做 异常 表 (exceptiontable) 
HUBER, Et B EUR ONE. 到 一 个 专门 设计 用 来 处 理 这 类 事件 的 棵 作 系 统 子 程序 
--ЖЖАНЯА (exception handler). 

“А ДИНЕН ЕЛАК i, Wick STIS, Е в 一 种 ; 

|. 处 理 程序 将 控制 返回 给 当前 指令 Ieur( 当 事件 发 生 时 正在 执行 的 指令 )， 

2. 处 理 程 序 将 控制 返回 给 Inext “如果 没有 发 生 异 常 将 会 执行 的 下 一 条 指令 )。 

3， 椒 理 程 序 洗 止 被 中 断 的 程序 。 

8.1.2 攻 将 讲述 基于 这 些 可 能 性 的 更 多 内 容 ， 
жз. BIRERE 

Ct+ 和 Java HAA R it k SURGE “ЖЖ” EARE h Chio Java 以 catch, throw пу 语 
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e) E ДЖА) EAR SA ЕСЕ, ЖАТ, АЛЛЕЯ UP de "ud" АЖ, (e 
Aug XC Ee), ҚЖАРТАФИЕ ЖАРАН АЯУ, 


8.1.1. 异常 处 理 

异常 可 能 会 礁 以 理解 ， 国 为 处 理 异 常 圳 要 但 仁和 软件 紧 窗 合 作 。 很 容易 摘 混 哪 个 部 分 执行 哩 个 
35, CRTE FAKER HTAR TE, 

EHRE J EF M ДЕНІ RAT — E НЕ ERA Т Ж (exception number), 1% 
ЧЕ АЕ д РНК Н ЫТЫ. Rib ЛЕШЕ ES ҖИ ERA ШЇ 
ИЮЛ) RU TERES. ТИК КАДА ЕЕ. RR. Аалы. Ит, АИЛ. 
Ки луй ЯН ЖЖ ЕКА VO 设备 的 信和 续 。 

ТЕ ЖАЛ ЫЛЕ СИЕ I Sz $E DDR REO, MeTE АЛ Ba siga k, КО A8 LEE HE К. 
НКЕ e FA КАКИЕ АҢ. 图 8.2 BE; r - 张 异 常 表 的 格式 。 


Te RE HB 0 (ЕЗ 
ЕЖЕННІҢ 


异 节 处理 程序 2 УТЫ 





异常 处 理 程 序 n-1 ВЧ 


62 异常 表 
FEKE КВН, HHAH 包含 失常 上 的 处 再 程序 代码 的 地 址 ， 


由 运行 时 ( 污 系 统 在 执行 基 个 称 序 时 )》， 处 理 费 检测 到 发 生 了 -个 事件， 并 县 博 定 了 相应 的 异 和 党 
SXK。 随 乒 ， 处 理 器 触发 异常 ， 户 法 是 执行 间接 过 程 调用 ， 通 这 异 沪 表 的 表 日 k， 转 到 相 诺 的 处 理 程 
TF. 图 8.3 Жо ТЕН ЛЕГЕН Е АЕ За Н АКН Е НЕ. РИНЕ Ер 
Pob, ЖЕЖ ab (C ШИ ЖОК ЖА 3 5 S (exception table base register) [ЧК CPU 
ан. 

AX TRE. НЕЛ- ЯЛАН 2 Sh. 

e ТЕЛИН, СЕВЕРЕ Е П, АЕ А ahha t. 然而, 根据 异常 的 类 型 ， 
Anm hp A Rame CIR EBMICmDBSET. WSARBT—ERSS Un 
^A. ЖЕ 3 HR IATER SO. 

. CRRA ЧЕМ ИК МЕН, 在 处 理 程序 返回 时 , 重新 开始 被 中 断 的 程序 会 
MR Ах, 比如， 个 1A32 系统 将 包含 当前 条 件 码 的 EFLAGS 寄存 器 和 其 他 一 些 东 是 
ЖАВ. 
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e 如 果 控 制 从 一 个 用 方程 序 转移 到 内 核 ， 所 有 这 些 质 月 《itemy) 都 被 正 到 内 核 栈 中 ， 而 不 是 讨 
到 用 户 栈 中 ，。 

e 异常 处 理 程 序 运 行 在 内 核 模式 下 (823 W), 这 意味 着 它 科 对 所 有 的 系统 资源 事 有 完全 的 访 

їн] ҖИМ. 

HAHET ROW. МҮНІЛЕКЕННА АЕ ЕЛЕНЕ. ЖАННЫН АКИ [RE 
之 后 ， 它 通过 执行 “ЖАНЫ “АФ” 78%, "ПЕНДЕ ЕТЕНЕ, ia o rm aM 
状态 绰 回 到 处 理 器 的 控制 和 数据 寄存 器 中 ， 将 状态 恢复 为 用 己 寞 式 (823 P), ИЖЕ ТЮЕ 
一 个 用 户 程 谍 ， 然 后 将 控制 返回 给 被 中 断 的 程序 ， 


异常 号 
(х4) ++ 






ЕК E B PS 





Fes SER 38 | 
n-1 2-0 | 


83 ERF RANE ЕРНІН 
Роя. 


8.12 FERKA 
AEEA: ФИ 《interrupt)、 陷 阶 (ғар). ЖОҒ CfaulD 和 终止 【abort)。 图 8&.4 中 的 
表 对 这 些 类 别 的 属性 做 了 小 结 。 






"IIT TUTUIMTT 
Res it EIE fnis: B RER ||) F — $a 
W B £C HT ЫНЫ lš 同步 Е АЕ ЕТТЕ У 
£p 


n RR dO E VR 同步 不 各 返回 


& 85.4 Sg 

Fe+ RC i Ap SHE UO 设 和 项 中 的 事 仁 产 先 的， 同步 异常 是 执行 -条 指令 的 育 接 产物 。 

中 斯 

中 断 是 异步 发 生 的 ， 是 来 白 处 理 器 外 部 的 ПО 设备 的 信号 的 结果 。 硬 件 中 断 不 是 由 任何 一 条 专 
门 的 指令 造成 的 ， 从 这 个 意 六 二 来 说 它 是 异步 的 。 重 件 中 断 的 蜡 常 处 理 程 序 常常 被 称 为 中 断 处理 程 
BF (interrupt handler), 

图 8.5 概述 了 一 个 中 断 的 处 理 ，LUO 设备 ， 例 如 网 络 适 配器 、 磁 盘 控 制 器 和 定时 路上 芯片 ， 通 过 癌 
处 理 器 必 片 上 的 一 个 管 脚 发 信号 ， 并 将 异常 号 放 到 系统 总 线 上 ， 来 触发 中 断 ， 这 个 异常 号 标识 了 引 
起 中 新 的 设备 。 

和 在 当前 指令 完成 执行 之 前 ， 处 理 器 注意 到 中 断 管 靶 的 电 此 变 高 了 ， 就 从 系统 总 线 读 束 异 常 号 ， 
汰 后 调 几 适 尖 的 中 断 处 理 程序 。 当 处 理 程 序 返回 时 ， 它 就 将 控制 返回 给 下 一 条 指令 〈 也 就 是 ， 如 果 
没有 发生 中 断 ， 在 控制 流 中 会 在 当前 指令 之 后 的 那 条 指令 )。 结果 是 程序 继续 执行 ， 就 好 橡 没有 发 生 


506 8% 


Мт 4. 


Ө КИТЕЛ (ЮЖ, ат ә ААВ ЕЈ, Edhir ЧАЦЕ HER, BIERKE 
ЩА Р Jë (faulting Instruction). 










(2) A BLR Е, 


(DESAI SE ТРН d Rp ET 





` (3) 
管 脚 电量 变 高 了 SANE 
(4) ЕНЕ 
回 芭 下 - :条 指令 
图 85 Е 
中 断 录 理 程序 料 控制 返回 嫩 应 有 程序 控制 流 中 的 下 dE. 


ІР? 

陷阱 是 有 意 的 异常 ， 是 执行 一 条 指令 的 结果 。 就 像 中 断 处 理 程序 一 样 ， 陷 阱 处 埋 程 序 将 控制 返 
ӘК -条 指令 。 陷 阱 最 草 要 的 转达 是 在 用 广 程序 和 内 核 之 间 提 供 一 个 像 过 程 НЕП, ПКА 
5158 f o 

ШЕЛГЕ АЕ S Ж] АКОН Ж Ж. Пе ОВЕ tread)、 创 建 一 个 新 的 进程 Cork. WME 
一 个 新 的 程序 Сехесуе), ЖАГИЯ (exit). Xj T ARAE A EH AMI E. ЯН 
ПЕ 7 ЭВА) “syscall n” 指 令 ， 当 用 户 程 序 想 鉴 请 求 服务 n 时， 可 以 执行 这 条 指令 ,执行 
хуѕса 指令 会 导致: ТИНЕ ГЕННЕН, ЖАЗА НЕН ЕДЕН, БЕНЕН, 
图 8.6 概述 了 个 系统 调用 的 处 理 ， 







(2) 控制 传递 
» : 
(1) 应 用 得 序 执行 syscall ЧАР 
KE SURI ed (3) МЕ 
FRE 
(4) 处 蛙 程 序 返 回 到 
syscall 27 Е 


图 8.6 陷阱 处 理 
Res Ern FER ERE ЫЫ 5s P RE ER E P PITT – dE. 

Э-ЖЕ ЖЕ, ЖӨНЕЛТЕ АБД Е- - 样 的 。 然 而 ， 它 们 的 实现 是 非常 不 
同 的 。 首 通 的 函数 运行 在 用 户 模式 《user mode? 中 ， 用 户 模式 限制 了 函数 可 以 执行 的 指令 的 类 型 ， 
而 且 它们 只 能 访问 与 调用 函数 人 同 的 栈 。 系 统 调用 运行 在 内 核 模式 (кепе! mode? 中 ， 内 核 模式 允 
洗 系统 调用 执行 指令 ， 并 访问 定义 在 内 核 中 的 栈 。8.2.3 闻 会 更 详细 地 讨论 用 户 模式 和 内 核 模式 。 
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KE 

cB E RTL АЕ, ЗІР ИЕЛЕ. "i УИ ЕН, ЖНЖ НИЕ 
MUSEI. ШЖ ЖЕРГ ДЕШЕ FK МЕ НЫ, CR EAR Ја РЕВ, ЖІП ТІ АТ 
它 。 和 否则 ， 处 理 程 译 返 巴 到 内 核 让 的 abort БІЛЕ, abort [Ee ES LES ЕТИК УН PET. (877 概 
МГ-НАН, 





(2; 控制 传递 
(1) 当前 指令 SY Rk BEER 
чаман CT (3) ШІН 
程序 运行 
——— k abort 
(4) 处 理 程序 要 人 各 重新 


图 8.7 故障 处 理 
НЕЗ ВИ BEI S. MERRTE RATAA TARE. 


HER- "PES RB ES UL m. SETRA ЕМЕН, ifm АЛЫН ROSE PE H9 E 93 IB AP 
Ҥй. ТАО МЕНН НЕ, WAAGE. MERIKA 10 章 中 看 到 移 那 样 ， 
一 个 页 面 就 是 不 所 存储 器 的 一 个 连续 的 块 CRUBIBI S 4KB)。 缺 页 处 理 程序 从 磁 检 加 载 适 当 册 页面， 
然后 将 控制 返回 给 引起 故障 的 指令 ， 当 指令 再 次 执行 时 ， 相 应 的 物理 页 面 已 经 驻 留 在 存储 器 中 了， 
指令 就 可 以 泪 有 故障 地 运行 完成 了 。 

i 

AEAU C I caa SR АШЫ 9 —— E 一 些 硬 件 错误 ， 比 如 DRAM 或 者 SRAM 
АТА IST ERTER UR. ЕЯ РЕАЛА АЧ ИНЕ [ELS S EE. ШІН 88 所 示 ， 处 理 程序 
将 控制 返回 给 一 个 abot ЖЖ, ES ER OX ЖЫ ЕР. 





(2) ЕЕ 
(D REMM , HAERE 
Wa m (3) 终止 处 理 
程序 运行 
m p abort 
(4) ABRE EE Us [ul 
fl арсгі Й 


ің 68 Ж ГДЕ 
A ARTE Б НЕДЕ: “个 内 核 ahort WEE. AAEH LECTURER, 


813 Intel 处 理 器 中 的 异常 

为 了 使 描述 更 具体 ， 计 我 们 来 看 看 为 Intel 系统 定义 的 一 些 异常 。 一 个 Pentium 系统 可 以 有 高 达 
256 种 不 同 的 异常 类 型 。 范 围 0—31 的 号 码 对 应 的 是 Pentium 体系 结构 定义 的 异常 ， 因 此 对 任何 
Pentium 类 的 系统 都 是 一 样 的 。 ШІН 32-255 的 叶 码 对 应 的 是 操作 系统 定义 的 中 断 和 陷阱 。 图 8.9 Ж 
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Г “ЖИ, 
uu “НАНКИН. А з 1 HE PT RECHT HL ED Т Р, ЙӨ 
DEW (ЖИ 0). Unix ЖАЛАШ АЕН D CAE. Im HEC НЕНЕН РЕ. Unix shell 8 i ede p 











PEREN 
181 
ШІ 111. 
B? Pentium ЖФ Р: 

叶 委 加 国都 会 导 至 不 为 人 知 的 一 般 保 护 故 障 CREE 13)， 通 常 是 因为 一 个 吝 序 引用 了 一 小 来 定 
各 的 虚 扫 存储 器 区 域 , 或 者 因为 程序 试图 写 一 沾 内 读 的 变 本 段 。Unix ЖЫ ИШ ЖД. Unix 
shell dk 1 b Be DEP НЕРІН “ЕНІ (Segmentation fault) ". 

ий CUM o dez REL MH О Р сн. OSP ЕНЕ N А Ыы ЕНУ 
ЇЧ GLO 3 4 dit MOL fe Т WISE SOT SAC. 我们 将 在 第 10 章 中 看 到 这 是 如 
ІШІ ЕМ W. 

ШЖК ЙЕ 18) 是 在 故障 指令 执行 中 检 油 到 致 会 的 硬 尾 展 误 时 觉 生 的 ， 机 器 检查 处 理 程序 
避 趟 退回 控制 给 应 用 程序 ， 

ЇЕ 1А32 系统 上 , 系统 调用 是 通过 一 条 蒜 为 INT 的 陷阱 指 专 来 提供 的 , JOB n ape ЕР 
256 T-EH'PIEB— THES.: 在 历史 上 ， 系 续 码 用 是 通过 异 带 128 (0х0) 提供 的 ， 
ян. AFAR N 

БЕЗ РТТ РТ ТЕ 
Kj "ba" demde “АЖ”, ie LAE Rd iE k doin piede umbrella ЖҰ. 3 T3 
T ФИ" ux PRAT ФИ", Ап AUC йл e Kik, GE RT 
ФЕЯ (PR) e ERE (D. НИ). EtA MEHEA, Ят 
ARAT., Kdatertdpbiagd, editi bed 35. 24n Y^ dude 
q33Xjipkémreuvraeuet. 


8.2 进程 
ҒҰН ЖЕНЕ, Ç fe THIUIEOR HOILULHHE (process) 的 概念， 进程 是 计算 机 科学 中 最 
SIE uote —., 


АП ТАҢ LEHER. ИТ Ч, GRE ПЕЛ RAE 
ANS TIPINL PUE. ЖИПТЕ ДАН НИЕ НЕШ. ИШИ BRE XE TE — 


ттт 
EE 
Ж Ж ПРА 
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条 接 - -条 地 执行 我 们 程序 中 的 指令 。 最 后 ， 我 们 程序 中 的 代码 和 数据 显得 好 像 是 系统 存储 器 中 惟一 
的 对 象 。 这 些 假象 部 是 遂 过 进程 的 概念 提供 给 我 们 的 。 

进程 的 经 典 定义 就 是 一 个 执行 中 程 座 的 实例 。 系 统 中 的 每 个 程序 都 是 运行 在 某 个 进程 有 的 上 下 文 
(context) 中 的 。 上 下 文 是 出 程序 正确 送行 所 需 的 状态 组 成 的 。 这 个 状态 包括 存 坡 在 存储 器 中 的 程 
序 的 代码 和 数据 、 各 的 栈 ， 它 的 通用 目的 寄存 器 的 内 容 、 它 的 程序 计数 器 、 环 境 变 量 以 及 打 并 文件 
描述 符 的 集合 。 

每 次 用 户 通过 向 shell 输入 一 个 可 执行 日 标 文 件 的 名 宇 ， 运 行 一 个 程序 时 ，shell 2:8] — 37 
的 进程 ， 然 后 在 这 个 新 进程 的 上 下 文中 和 运行 这 个 可 执行 日 标 文 件 ， 应 用 称 序 还 能 够 创建 新 进程， 且 
在 这 个 新 进程 的 上 下 诡 中 运行 它们 自己 的 代码 或 其 他 应 用 程序 。 

关于 拧 作 系统 如 和 何 实现 进程 的 细节 的 讨论 超出 了 我 们 的 范围 取而代之， 我 们 将 关注 进程 提供 
给 应 用 程序 的 关键 抽象 ; 

s 一 个 独立 的 膛 辑 控制 流 ， 它 提供 一 个 假象 ， 使 我 们 觉得 我 们 前 程序 独占 地 使 用 处 理 占 。 

ТАЕНЕ 81, CER- TES, ERI MIERA EA A ir E H E Ma АЯ, 

让 我 们 更 深入 地 看 看 这 些 柚 象 。 
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典型 地 ， 即 使 在 系统 中 有 许多 其 他 程序 在 运行 ， 进 程 也 可 以 向 每 个 程序 提供 一 种 假象， 好 像 它 
在 独占 地 使 用 处 蛙 器 。 如 果 我 们 想 用 调试 器 单 步 执行 我 们 的 程序 , 我们 会 看 到 一 系列 的 PC (程序 计 
280 НИЕ, AERE 一 地 对 应 于 包 人 省 在 我 们 程 许 的 可 执行 是 标 文件 中 的 指令 或 是 包 舍 在 运行 时 动 
态 链 嫉 到 我 们 程序 的 共 孚 对 竹中 的 指令 。 这 个 PCÍBIIFEXUILUNGSE EE e E. 

考 启 一 个 运行 着 二 个 进程 的 系统 ， 如 图 8.10 所 示 。 处 理 器 的 一 个 物理 控制 流 被 分 成 了 二 个 还 辑 
流 ， 每 依 进 程 一 个 。 每 … 个 竖 直 方向 上 的 列表 示 一 个 进程 的 逻辑 流 的 - -部 分 。 在 这 个 例 了 中 ， 进 程 
A 运行 了 一 会 儿 ， 然后 是 B 开始 运行 到 完成 。 然 后 ，C 运行 了 一 会 儿 ，A 接着 运行 和 直到 完成 , 最后， 
C 可 以 运行 到 结束 了 ， 





图 810 ”逻辑 控制 流 
ЖЕЛЕ REPOT -种 假象 ， 好像 程序 在 独占 地 使 用 处 理 器 。 每 一 轻 自 方 出 上 约 列 表示 “个 进 各 的 这 辑 控制 流 的 -- 部 分 ， 


Н 810 的 关键 点 在 于 进程 是 轮流 使 用 处 理 器 的 。 每 个 进程 执行 它 的 流 的 一 部 分 ， 然 后 被 抢占 
(preempted ) 暂时 挂 起 )， 与 此 同时 其 他 进程 开始 执行 。 对 寺 一 个 运行 在 这 些 进 程 之 --- 的 上 下 文中 的 
三 序 ， 包 看 上 去 就 像 是 在 独占 地 使 用 处 理 器 。 惟 一 揭 反 面 例 证 是 如 果 我 们 精确 地 测量 每 条 指令 使 用 的 
时 间 ( 参 见 第 9 章 ), 我 们 将 发 更 在 我 们 程序 中 - 些 指令 的 执行 之 间 , CPU 好 像 会 周期 性 地 停顿 (stal)。 
然而 ， 每 次 处 理 器 停顿 ， 它 随后 继续 执行 我 们 的 程序 ， 并 不 改变 程序 存储 器 位 置 或 寄存 器 的 内 容 。 

 - 般 而 言 ， 和 不 同 进程 相关 的 逻辑 流 并 不 影响 任何 其 他 进程 竟 状 态 ， 从 这 个 意义 上 说 ， 每 个 逻 
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AA A ry K hipa A). ЧИНЖНИКЦ ЖЕН (IPC) ШЕ, КҮНІН, ЧЕЧ, MX 
ФЕИ Has К, АЖЕ Riba РО n i. ARRUN НЕ Е. 

ЇН ИГЕ [п] E3159 5199 22 ИЖЕ PE EFE ДЖ ie (сопсштеп process), MAA 
ИН ЕЕ YI EGT. ЕШ, B 84015, ЖИ AN BAERE. АШ СЕ. 8-3 
B, ВЛСНЛЕНЯЕНІН, BIS BERE ȘIR EECCA XI matrim. 

E PIR hour ЕТ ERE ЖЛ $ ER Omalütasking). ЗЕН TE M АНС Е E 
riy mf] i n rt] М (time slice). [ib ЖЕ {ШШ ҤЙ Н Cume slicing). 


822 私有 地 址 室 间 

dpud chap EIER WES. ARCET A ER HERBES D. dE— fs gn 位 地 址 的 
HL F, ЖЕН R 2 n АНИНЕ}. 0. 1, e 7-1. AERA NETIHRUTAECE B сояе 
deaur. HTA., ЖД АЖЕ MT e hp XE EP fh y h RUF ES JUI ERE UE DE 
写 的 ， 只 说 个 意义 上 说 ， 这 个 地 址 空间 是 私有 的 ， 

HERE T fT hhi e R| E Er А p RETAN. PERRA NE s) REH HEI 
неш. ЕШ. ЕЛ1 展示 了 一 个 Linux t B Jb hb [8] 95549. Mich sts fia iit i I DU 5 — ЕН 
APREN БИЕШ ЖЖ. ИЖ. НӘШ. АНЕ Тал АЕА — Ri А EEG. Hh 
МЕ ч aperi yta s РНЕКӘНЕНАННӘН (ЕШ. SEARA- tE CTI 
ЕШ. ЖИ. 
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823 用户 模 式 和 内 核 模 式 

为 了 使 换 作 系统 内 核 提 供 一 个 无 局 可 击 的 进程 抽 银 ， 处 理 器 必须 提供 一 和 机 制 ， 限 制 一 个 应 用 
可 以 执行 的 带 令 以 及 它 可 以 访问 的 地 址 室 间 范围 。 

典型 地 ， 椒 理 器 是 用 某 个 控制 寄存 器 中 的 一 个 方式 位 (mode bit) 来 提供 这 种 功能 的 ， 访 寄存 
器 描述 了 进 召 当前 膏 有 的 权力 。 当 方式 位 设置 了 时 ， 进 程 就 运行 在 内 核 模 式 中 《有 了 时 岂 做 起 级 用 户 
EK) 一 个 运行 在 内 核 模式 的 进程 可 以 执行 指令 集中 的 任何 指令 ,并 日 可 以 访问 系统 中 任何 存 情 器 
位 置 。 

方式 位 没有 设置 时 ， 进 程 就 运行 在 用 户 模式 中 。 用 户 模式 中 的 进程 不 人 多 洗 执 行 特权 指令 
(privileged instimction》， 比 如 停止 处 理 峰 、 改 变 方 式 位 的 值 或 者 发 起 一 个 TO 操作 ， 也 涉 允 许 用 户 
模式 中 的 进程 直 恋 引用 地 址 字 间 中 内 核 区 内 的 代码 和 数据 。 任 何 这 样 的 尝试 都 会 导 和 政 改 命 的 保护 故 
障 。 用 户 程序 必须 通过 系统 调用 接口 间接 地 访问 内 核 代码 和 数据 ， 

一 个 运行 应 用 程序 代码 的 进程 初始 时 是 在 用 户 模 式 中 的 。 进 程 从 用 户 模式 变 为 内 核 模式 的 惟一 
并 法 是 通过 语 如 中 断 ， 故 障 或 者 陷入 系统 调用 (trapping system call) ЫЛ. SAREEN, 
控制 传 过 到 异 吊 处 型 程序 ， 人 处 理 器 将 模式 从 用 户 模 式 变 为 内 核 模式 。 椒 理 程序 运行 在 内 核 模 式 中 ， 
当 它 返回 到 应 用 代码 时 ， 处 理 器 束 把 模式 从 内 核 模 式 改 问 到 用 户 模式 ， 

Linux 和 Solaris 提供 了 - -种 聪明 的 税制 ， Штос 文件 系统 ， 它 允许 用 户 模式 进程 访问 内 核 数 
据 绪 构 的 内 容 , /proc 交 忻 系统 将 许多 内 核 数 据 结 构 的 内 容 输 出 为 一 种 用 户 程 序 可 以 读 的 ASCII 文件 
的 层次 结构 。 比 如 ， 你 可 以 使 用 Linux мос 文 性 系统 找 出 一 般 的 系统 局 性 ， 比 姑 CPU 类 型 
(fprociepuinfo)， 或 者 菜 个 进程 使 用 的 存储 器 段 (/proc/<process id>/maps), 


824 上 下 文 切 换 

探 作 系统 内 核 利 用 一 种 称 为 上 下 文 切 措 (context switch) 的 较 高 级 形式 的 异常 挤 制 流 来 实现 多 
任务 。 上 下文 切换 机 制 是 建立 村 我 们 在 8.1 节 中 已 经 讨论 过 的 那些 较 低层 异常 机 制 之 上 的 。 

内 核 为 每 个 进程 维持 一 个 上 下 文 (context)。 上 下 交 就 是 内 核 重 新 启动 一 个 被 抢占 进程 所 需 的 状 
Ж. HD 一 些 对 章 的 值 组 成 ， 这 些 对 象 包括 通 用 目的 寄存 器 、 浮 点 寄存 器 、 鹅 序 计数 器 、 用 户 栈 、 
状态 寄存 器 、 内 核 栈 和 各 种 内 核 数 据 结构 ， 比 如 描 给 地 址 空间 的 页 表 (page table)、 包 含有 关 当 前 
进程 信息 的 进程 表 《process table)， 以 及 包含 进程 已 打开 文件 的 信息 的 文件 表 Cik table). 

在 进程 执行 的 某 些 时 刻 ， 内 核 可 以 决定 抢占 当前 进程 ， 并 重新 开始 一 个 先前 被 抢占 的 进程 。 这 
КЕРДЕРІ ИЛ (scheduling)， 是 出 内 核 中 称 为 调度 器 (scheduler) 的 代码 处 型 的 。 当 内 核 选择 
一 个 新 的 进程 运行 时 ， 我 们 就 说 内 核 调度 了 这 个 进程 。 在 内 核 调度 了 一 个 新 的 进程 运行 后 ， 它 就 抢 
山 当 前 进程 ， 并 使 用 一 种 称 为 上 下 诡 切 换 的 机 制 来 将 控制 转 称 到 新 的 进程 上下文 切换 可 以 : OR 
存 当 十 进 程 的 上 下 文 ， 包 恢复 某 个 先前 被 抢占 进程 所 保存 的 上 下 文 ; 鲍 将 控制 传递 给 这 个 赣 恢 复 的 
进程， 

当 内 以 代 表 用 户 执行 系统 调用 时 ， 可 以 发 生 上 下 文 切换 。 如 果 系 统 调用 因为 等 竺 某 个 事件 发 生 
而 阻 曼 ,那么 内 核 可 以 引 当 前 进程 休眠 ， 切 换 到 另 一 个 进程 。 比 如 ， 如 果 一 个 read 系统 调用 请 求 … 
个 磁盘 访问 ， 内 核 可 以 选择 执行 上 下 文 切换 ， 运 行 另 外 -个 进程 ， 而 不 是 等 待 数据 从 磁盘 到 达 ， 另 
一 个 示例 是 sleep 系统 调用 ， 它 显 式 地 请 求 让 调用 进程 休眠 。 一 般 而 言 ， 即 使 系统 调用 没有 阻塞 ， 
内 核 也 可 以 决定 执行 上 下 文 切换， 而 不 是 将 控制 返回 给 谢 用 进程 。 
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路 断 也 可 能 引发 上 上下文 切换。 比如， 所 有 的 系统 都 有 某 种 产生 周期 性 定时 器 中 断 的 机 制 ， 典 型 
f f 1 毫秒 或 每 10 毫秒 。 每 次 发 咎 定时 器 中 断 时 , 内 核 就 能 判定 当前 进程 已经 运行 了 由 够 长 的 时 
WHT. HHR Үйіміз. 

图 812ЕжІ-ХИБВАЯВСОНЕКИЯЛЕКЖЙ, EAA r, AR, ИТ А = 
行 在 用 户 模式 中 ， 直 到 它 通 过 执行 read 系统 调用 陷入 到 上 内核。 内 核 中 的 陷阱 处 理 程序 请 求 来 目 磁 
村 控制 器 的 DMA 传输 ， 并 在 磁 稳 控制 器 完成 从 磁盘 到 存储 器 的 数据 传输 后 ， 要 求 磺 盘 中 断 处 理 
aS 


时 间 HEA 进程 日 
{ | 用 户 模式 
read -- * ' . 
— ТТЕ } Е 下文 切换 
用 户 模式 


№. read аі eet й Г НВА | LE FXUS 
) 用 广 模式 


图 8.12 进程 上 下 文 切换 的 剖析 


磁盘 取 数 据 要 用 - - 段 相对 较 长 的 时 间 《数量 级 为 十 几 总 秒 )， 所 以 内 核 执行 从 进 称 A 到 进程 B 
的 上 下 文 切换 ， 而 不 是 在 这 个 间 数 时 间 内 等 待 ， 什 么 都 不 散 。 注 意 在 切换 之 前 ， 内 核 正 代表 进程 和 
在 用 户 模式 卜 执行 指令 。 在 切换 的 第 一 步 中 ， 内 核 代表 进 穆 A 在 内 核 模式 下 执行 指令 。 然 后 在 某 一 
时 刘 ， 它 开始 代表 进程 BB (仍然 是 内 核 模 式 下 ) 执行 指令 。 在 切换 完成 之 后 ， 内 核 代表 进程 B 在 用 
户 模式 下 执行 指令 ， 

Л, EE BEH ERTE- AJL HARARE ARRET, Xo UR DLE AREE 
送 到 了 存储 器 。 内 核 判 定 进程 В 已 经 运行 了 足够 长 的 时 间 了 ， 就 执行 一 个 从 进程 B 到 进程 A 的 上 
下 文 切换 ， 将 控制 返回 给 进程 A 中 紧 随 在 read 系统 调用 之 后 的 那 条 指令 。 进 程 A ЫТ, AD 
下 一 次 异常 发 生 ， 依 此 类 推 。 
НЕ, BRERA (pollution 和 异常 控制 流 

一 般 而 言 ， 硬 件 高 速 线 存 存储 器 不 能 和 诸如 中 断 和 上 下 文 切换 这 样 的 异常 控制 流 很 好 地 交互， 
如 果 当 前 进程 故 一 个 “中 叫 ”暂时 中 断 ， 那 么 对 干 中 断 处 理 程序 来 说 高 速 缓存 是 内 的 【cold) 1。 如 
果 处 理 程序 从 主 存 中 访问 了 足够 多 的 表 目 ， 那 么 当 被 中 断 的 进程 继续 时 ， 高 速 缕 存 对 它 来 说 也 是 准 
的 了 。 在 这 种 情况 中 ， 我 从 就 说 〔 中断 } 处 理 程序 污染 (polle) 了 高 速 缓存 。 使 用 上 下 文 切换 也 


会 发 本 类 似 的 现象 . 当 一 个 进程 在 上 焉 文 切换 后 继续 执行 时 ， 高 速 角 存 对 于 应 用 程序 而 言 也 是 准 的 ， 
站 须 再 次 热身 ， 


1 “高 速 继 存 是 冷 的 ”意思 是 程序 所 瑚 要 的 数据 部 不 在 名 速 组 在 中 ， 一 一 译 者 
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83 系统 调用 和 错误 处 理 


Unix 系统 提供 了 人 大量 的 系统 调用 ， 当 应 用 程序 想 向 内 核 请 求 服务 时 ， 比 如 读 取 一 个 文件 ， 或 者 
创建 一 个 新 的 进程 ， 孝 可 以 使 用 这 些 系统 调用 。 例如 , Linux 提供 了 大 约 160 个 系统 调用 。 输 入 “man 
syscalls"， 你 将 得 到 完整 的 列表 。 

С 程序 通过 使 用 “man 2 intro” 里 描述 的 _syseall 室 ， 可 以 直接 调用 任何 “系统 调用 ”， 然 而 ， 
通 串 训 接 调用 “系统 博 用 ” 虹 不 必要 区 不 值得 .标准 已 库 提供 了 一 组 针对 最 党 有 时 系 统 调 用 的 方便 的 
f (wrapper) 胃 数 。 所 装 冰 数 将 参数 打 好 包 ， 通 过 适当 的 系统 调用 陷入 内 护 ， 然 后 将 系统 调用 的 
返回 状态 传递 给 调用 程序 ， 柑 我 们 下 和 面 章 忆 的 讨论 中 ， 我 们 把 系统 调用 和 它们 相关 的 包装 函数 可 互 
EH X АЖ. 

"4 Unix ЖАРА SOR SU RS). CANAS- ЖЕТ ЕЖЕ 3 оппо 来 表示 什么 
ШГ. EFAA t W ПАШ НА, ETENE, ЖАНАҚ ТАЗА. MAUS 
TAR, MEELTE. Шш, PERO HALE] Unix fork AAN ШИ ИНГ У: 

1 if ((рій = fork()) < 0) 1 

2 fprintf (stderr, "fork error: %в\п", Strerror errno)}:; 

3 exití0); 

4 } 

strerror #58 У, TERR ТАП ermo 值 相 关联 的 错误 。 通 过 定义 下 面 的 错误 报告 

8 (error-reporting ftncion)， 我 们 能 够 在 某 种 程度 上 简化 这 个 代码 ; 


i void џліх еггог(сҺаг *msg) /*unix-style error */ 

2 1 

3 tprintfíistderr, "£s: $sin", msg, strerrorí(errno)); 
4 exitii: 

5 ] 


ПЯТ, RATE fork 的 调用 从 4 行 简化 到 了 2 17: 


i if ((pid = fork(;) < 0) 
2 unix erroríi'fork error"); 


通过 使 用 错误 处 理 包装 《enorhandling wrapper) 函数 ， 我 们 可 以 更 进一步 地 简化 我 们 的 代码 。 对 才 
一 个 给 定 的 基本 函数 foo， 我 们 定义 -个 具有 相同 参数 的 包装 孙 数 Foo， 但 是 第 一 个 字母 大 写 了 。 包 装 
函数 调用 基本 北 数 来 检查 错误 ， 如 果 有 任何 问题 就 终止 。 比 如， 下 面 是 fork КЕНЕН НАҚ. 
pid t Fork(void) 


{ 
pid t pid; 


if (ipid = fork[()) < 0) 
unix errorí("Fork error"); 
returr pid; 


со ~d Ch ММ gx 6 BI p 


) 
EATARRA. ЖАП fork 的 调用 就 缩减 为 1 行 ， 


ЕБ. 
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1 pid = Fork(); 

КПА ЕР АЕ) ДИЛ Р AES АУ АЗ ЕЕЕ Ра Ж. КИП ЖҮКЕ ЛҮ ИШИН, IH 
УА АННЫ, АЛЛАМ НЕЕ. НЕ, AREE P Hik АЈ AR, ШИП 
EJ ЛУН ЖАСЫ. HU O АУН А O KR. 

AT Unix fe ve 4b EE UL REP PiE HA АЛЕ ТАКИ. 请 参考 附 菜 B. Ера Е 
fE— HE сѕарр.с RJ ЯЕ, CARRE E X Е ОЦ csapp.h 的 头 文 件 中 。 为 了 便于 你 引用 ， 
И B BEBE [axe ETRAS. 


8.4 进程 控制 
Unix HEET KEA C HEFP TETERA RH. 这 HS ЕЕ ЖЕ УРА. ЛДАР АНД 
如 何 使 用 它们 。 
8.4.1 获取 进程 |D 
每 个 进程 前 有 一 个 惟一 的 小 数 СЕФО 进程 ID (PID). getpid 消 数 返回 调用 进程 的 PID. getppid 
HADZE ЕХ РІ) 《也 就 是 ， 创 建 调用 进程 的 进程 )。 
Binclude «unistd.h- 
*finclude zsys/tvpes.h- 


pid t getpidivold); 
pd t geLopiü(void); 


же: 调 朋 者 或 其 父 进程 的 PID. 
getpid 和 getppid В 05А] TAEA pida ВИН, F Linux 系统 上 的 types.h Че Е int, 


8.4.2 ”创建 和 终止 进程 
从 程 反 员 的 角度 ， 我 们 可 以 认为 进程 总 是 处 于 下 面 三 种 状态 之 一 : 
° 运行 。 进 程 归 么 在 CPU КАЛ, ЖА ЕА НЕ СЕЙ. 
暂停 ,进程 的 执行 被 挂 起 (suspended}, 甘 不 会 被 调度 。 当 收 到 SIGSTOP, SIGTSTP. SIDTTIN 
或 者 SIGTTOU 信和 号 了 时， 进 娃 就 暂停 ， 并 且 保 持 暂 停 直 到 它 收 到 一 个 SIGCONT 信号 ， 在 这 
个 时 刻 ， 进 程 再 次 开始 运行 。( 信 号 是 -种 软件 中 断 的 形式 ， 将 在 8.5 节 中 给 予 描述 。} 
б 终止 ,进程 水 过 地 停止 了 。 进程 会 将 为 二 种 原因 终 刷 : {Ж -全 信和 号, 该 信号 的 默认 行为 是 
终止 进程 :从 主 程序 返回 ， 调 用 exit 函数 。 
Éinclude zstdlib.h- 


void exitíint statusi: 


ix dd XR ВНЕ, 


exit Ж status ag HAS ИДЕ СЫ :种 设置 退出 状态 的 方法 是 从 主 种 序 中 捞 回 TEE 
S BD. 
多 进程 通 入 请 用 fork РАСЫ — N EE fT EF 





骨 常 控制 流 


#include «unistd.h- 
Біпсінде «sys/types.h» 


pid t fork(void); 
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жер. РЭА Е 0, ZERALA- aaa PID， 老 出 错 则 为 -1， 


新 创建 的 了 进程 全 乎 但 不 完全 与 父 进程 相同 。 子 进程 得 到 与 父 进程 用 户 级 虚拟 地 址 空间 相同 的 
(但 是 独立 的 ) -- 份 找 贝 ， 包 括 文本 、 数 据 和 bss 段 、 堆 以 及 用 户 槛 。 子 进程 还 获得 与 父 进程 任何 打 
开 文 件 摧 述 符 相同 的 找 贝 ， 这 就 意 昧 着 当 父 进程 调用 fork 时 ， 子 进程 可 以 读 写 父 进程 中 打开 的 任何 


文件 。 父 进程 和 新 创建 的 地 进程 之 间 最 太 的 区 别 在 于 它们 有 不 同 的 PID. 


fork 冰 数 是 有 趣 的 《也 常常 令 人 迷惑 )》， 因 为 它 只 被 调用 一 次 ， 却 会 返回 两 次 : 一 次 是 在 调用 进 
程 【 父 进程 ) 中 ，-- 次 是 在 新 创建 的 子 进程 中 。 在 父 进程 中 ，ferk 返回 子 进 程 的 PID。 在 子 进程 中 ， 
fork 返回 零 。 因 为 了 进程 的 PID 总 是 非 零 的 ， 返 回 慎 就 握 供 一 个 明确 的 方法 来 分 辨 程序 是 在 父 进程 
还 是 在 子 进程 中 执行 的 。 
图 8.13 展示 了 一 个 使 用 fork 创建 子 进程 的 父 进程 的 示例 ， 当 fork 调用 在 第 8 行 返回 时 ， 在 父 
进程 和 了 进程 中 x 都 有 值 !。 子 进程 在 第 ТО 行 增 加 并 输出 它 的 x 的 指 贝 。 相 似 地 ， 父 进程 在 第 15 


ТРАЕ У x ВЈ. 
1 iinclude "csapp.h" 
2 
i int maini} 
i { 
5 pid t pid; 
6 int x = 1; 
А 
8 pid = Forki); 
9 iÉ {pid == 0) 1 /*chld */ 
10 printfí'child : x-£din', ««x): 
11 exit(0); 
12 ) 
13 
14 /* parent */ 
15 printfi"parent: Xx-*dMn", --х); 
16 exití0); 
17 ) 


Ж 9.13 H fork 创建 一 个 新 进 织 


当 我 们 在 Unix 系统 上 运行 这 个 程序 时 ， 我 们 得 到 下 面 的 结果 ， 


unix- ./ESrk 
parent: x=DÜ 


child : xz2 


code/ecf/fork.c 


code/ecf/fork.c 
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XX ИЕ T --Ж Ж A H: 

* 调用 一 次 ,返回 两 次 。fork AAG ОРЕН Н 次 , (BEBO EA TK — — К Ri I| Ж +: xit 
程 ， 一 次 是 返回 到 新 创建 的 子 进 程 。 对 于 只 创建 -- 个 子 进程 的 程序 来 党 ， 这 还 是 相当 简单 
的 。 在 是 含有 地 个 fork Ж КЕРЕН] НЕЙ TATE. ВТАА Г. 

s 半 发 执行 , 父 进 程 和 子 进程 是 并 发 运行 的 独立 进程 。 内 核能 够 以 仔 意 方式 变 检 执行 它们 则 辑 
控制 流 中 的 指令 。 当 我 们 在 系统 上 运行 这 个 程序 时 ， 父 进程 先 完成 种 的 printf 语句 ， 然 后 是 
FER. АШ. ЖЕН “个 系统 上 可 能 正 寻 相反。 一 般 而 言 ， 和 作为 程序 员 ， 我 们 盛 法 对 不 问 
讲 程 中 的 指令 交替 执行 做 任何 假 巩 ， 

* 相同 的 但 是 独立 的 地 址 室 间 。 如 果 我 们 能 够 让 fork РАЖ {ЕУ ЕЛІ T ДН НЕ т МЫП Ж 
ІНЕН, ПЕН ФЕ ЕН НЕРІН Ар AR RIED). МИЯ НІН), 
ЖЕН Kh E REEL. БМ. ЖЕНЕ НЫҢ, АННЫ. ІЛЕ, d RA PER 
ЖЕТ, 35 fork 图 数 在 第 8 行 返 问 时， 本 地 变量 xx 生父 进程 和 了 进程 中 都 为 |。 然而 ， 因 
为 父 进 各 和 子 进程 是 独立 的 进程， 它们 每 个 部 有 上 自己 的 和 有 地 帮 空 间 。 后 血 ， 父 进程 和 子 
ЖЧ x 所 做 莉 任 何 改变 都 是 独立 的 ， 不 会 反映 在 男 一 个 进程 的 存储 器 中 。 这 和 遍 是 为 什么 
当 人 多 进程 和 子 进程 调用 它们 各 自 的 printf 前 数 时 ， 它 们 中 的 变量 x 会 有 不 同 的 值 。 

e ЕХ. 当 我 们 运行 示例 程序 时 ， 我 们 注意 到 分 进程 和 子 进 种 痢 把 它们 的 输出 显示 在 屏幕 
土 。 原 因 是 子 过 程 侯 请 了 父 进程 记 有 的 打开 文件 。 当 父 进程 调用 fork 87, stdout LIFERI 
ИЕ, МЕн ж. ТАЖ Ж [ix TX HR. БИЕ: ТИШНЕ ТЕ. ЖЕТЕН ГЫ ЕЁ]. 

ШЖ ЕЛ ЕЛ fork ЯШ, ШЕ ДЖ ZU, КТЕ АЕ АМ ААА: 

布 执行 指令 的 进 各 ， 向 每 个 型 宜 的 箭头 对 应 于 fork 函数 的 执行 ， 

ІШІ, 298.14 (а) 中 的 程序 将 产生 多 少 输 出 行 呢 ? 图 8.14 cb》 给 出 了 相应 的 进程 图 。 当 父 进 
HATET TA -POREH -- Work ARH, 它 会 创建 一 个 子 进 程 。 每 个 进程 部 调用 一 次 printf, 
所 以 程序 打印 两 个 输出 行 。 

现在 如 时 我 们 如 图 8.14 (c) 所 示 的 那样 调用 fork 两 次 ， 会 怎样 呢 ? 就 像 我们 在 图 8.14 (d) 中 
看 到 网 那 样 ， 父 进程 调用 fork 创建 -个 了 进程 ， 然 后 父 进程 和 子 进 程 玫 调用 fork, АЛЕН C9 
EPERE. ЖІ, WRA 4 个 进程 ， 每 个 都 调用 priatf， 所 以 程序 就 产生 了 4 个 输出 行 。 

ЖӘЕ КЕН RA. ШАПАН fo 三 次 ， 如 图 8.14 (e) Ну. M SOS EH AN 
ТАН 8.14 CO 中 的 进程 图 中 看 到 的 那样 ，“- 共 会 有 8 个 进程。 每 个 进程 调用 printf， 所 以 
程序 就 产后 了 8 个 给 出 行 。 


l $include "csapp.h" 


2 
3 inb maini} 
4 [ 
5 Forkilt 
| hello 
5 printfí"hello'in"); 
exit [2); hello 
a | ҒогЕ 


(a) 调用 fork 07 СЪ 打印 内 个 输出 入 
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1 #include "csapp.h" 








2 
i int mairí) heilo 
4 í 
5 Forki); 
5 Forki); 
7 printfi"hello!in"); 
d exití(0); 
3 fork fork 
(c) HRH fork 两 次 (d) 打印 四 个 输出 行 
helle 
1 #include "сѕарр.ћ" 
2 
3 int maini} 
4 í 
2 Fork(); 
9 Fork): 
7 Forki}; 
8 printfí"heilo!in"); 
9 exitiD); | . 
10 } fark fork fork 
(e) 调用 fork 二 次 (o 打印 人 个 输出 行 
图 8.14 fork RAR 
练习 题 8 ,1 
考虑 下 面 的 程序 : 
code/ecf#forkprobD. с 
1 #include "csapp.h" 
2 
3 int maini) 
4 l 
Š int x = 1; 
5 
7 iE (Fork() == C) 
R printfí"printfl: x=%d%n", ++х); 
g printfi"printf2: x-&din", --х}; 
10 exit i0); 
11 } 
code/ecf/forknrobÜ.c 


A. POSER HT A? 
B. 父 进程 的 输出 是 什么 ? 
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练习 题 8.2 
下 面 的 程序 会 打印 多 少 个 “hello” 输 出 行 ? 


1 tinclude "csapp.h" 
2 
3 int mainit 
А | 
5 int 1; 
5 
7 for {1 = 0; 1 < 2: i++} 
B Fork); 
9 printfi"'helio!*sn"); 
10 exití(0); 
11 ] 
ӨЗ 83 


下 面 的 程序 会 打印 多 少 个 “hello” 输 出 行 ? 





мыз о — mn no ыл Lu М; rp 


ы Fa ые к — к = 
ің іп ни» ұм 03 LE г 





$include "csapp.h' 


void doit í) 


1 


lnt 


Forkí!; 
Forkil; 
printfí"hello*sn"l:; 


return; 


maini) 


Дол); 


princt'"helloxn"); 


exitii; 


843 回收 子 进 程 
A -个 进程 出 于 某 种 原因 终止 时 ， 内 核 并 不 是 立即 把 它 从 系统 中 清除 。 取 而 代 交 的 是 ， 进 程 被 
保持 在 -种 终 小 状态 中 ， 吉 到 被 它 的 父 进 答 回 收 【reaped)。 当 父 进程 回收 已 终 小 的 子 进 程 时 ， 内 核 


code/eci/fforkprab l.c 


code/ecfforkprob.c 


code/eclfforkprobá. c 


vode/eclfforkprobá.c 
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将 于 进程 的 退出 状态 传递 给 父 进 程 ， 然 后 抛弃 已 终止 的 进程 ， 从 此 时 开始 ， 访 进程 就 不 存 作 了 。 一 
修 终 和 下 了 但 还 未 被 回收 的 进程 称 为 必死 进程 《zombie )。 
次 注 ， 为 什么 包 姥 目的 字 进 程 称 为 生死 进程 ? 

在 区 间 传 说 中 ， 民 已 是 活着 的 尸体 ， 一 种 半 生 半死 的 实体 。 便 死 进程 已 经 终止 了 ， 而 内 楼 仍 保 
留 着 它 的 菜 些 状态 直到 艾 进 程 因 收 它 为 止 ， 从 这 个 意义 上 说 它们 是 类 似 的 ， 

如 果 父 进程 没有 回 站 它 的 恒 死 子 进程 就 化 目 了 ， 那 么 内 核 就 会 安排 init 进程 来 回收 它 科 。init 
进程 的 PID 为 1， 并 了 且 是 在 系统 初 冶 化 时 由 内 核 创建 的 。 长 时 间 和 运行 的 程序 ， 比 如 shell 或 者 服务 
器 ， 总 是 应 访问 收 它们 的 德 死 了 进程 。 即 使 尾 死 子 进 各 没有 运行 ， 它 们 仿 然 消耗 系统 的 存储 器 资 
We 

- 修 进 程 可 以 通过 调 月 waitpid ЛЕ ҒЫ ГЕН ІК ЕНЕ: 

include <sys/types.h> 
#incluje «sys/walt,.h- 


pid t ма1бр1й{р1а t pid, int *status, int options); 
返回 ; de A 5. ПАТ PID. AX WNOHANG， 则 为 0， 如 果 出 错 则 为 -1， 

waitpid AAT a M dv. SA BE C options=0 时 )，waitpid 挂 起 调用 进程 的 执行 ， 直 到 它 的 等 
竺 集合 中 的 一 个 子 进程 终止 。 如 果 等 待 集 合 中 的 一 个 进程 在 刚 调 用 的 时 刻 就 已 经 终止 了 ， 那 妈 
waitpid MHAP. FRAIA., waitpid 返回 导致 waitpid 返回 的 终止 子 进程 的 PD, ЖНЖ 
这 个 已 终 小 的 子 进程 从 系统 中 去 除 。 

判定 等 待 党 合 的 或 员 

tK UU H pid 来 确定 的 ， 

. WE pid>0， 那 么 等 符 集 合 就 是 一 个 单独 的 子 进程 ， 它 的 进程 ID €T pid. 

а ЖЯ Pid=-1， 那 么 等 竺 集合 名 是 由 父 进程 所 有 的 子 进程 组 成 的 。 
Aut. SERRE Df 

waitpid 西数 还 支持 其 他 类 型 的 等 待 集合， 包括 Unix 进程 组 ， 对 此 我 们 将 不 做 讨论 。 


修改 默认 行为 

可 以 通过 用 常量 WNOHANG 和 WUNTRACED 的 不 同 组 合 来 设置 options， 修 改 默 认 行 为 ; 

e WNOHANG: 如 时 没有 等 秆 集合 中 的 任何 子 进 程 终 止 ， 那 么 就 立即 返回 (返回 值 为 0). 

* WUNTRACED: 挂 起 滑 用 进程 的 执行 ， 直到 等 特集 合 中 的 一 个 进程 变 成 终止 的 或 者 被 暂停， 
返回 的 PID 为 导致 返回 的 终止 或 暂停 子 进程 的 PID. 

. WNOHANGIWUNTRACED: 立即 返回 ， 如 果 没 有 等 待 集 人 台中 的 任何 子 进 程 停 直 或 终止 ， 那 
么 迟 同 值 为 G， 或 者 返 同 值 等 于 那个 被 停止 或 者 终止 子 进程 的 РІР. 

检查 已 加 收 子 进程 的 进 由 状态 

ШЖ status 参数 是 非 空 的 ， 那 么 waitpid 就 会 编码 关 十 导 答 返回 的 子 进 程 的 状态 信息 到 status 2 

TE. мал 包含 文件 定义 了 解释 status 参数 的 几 个 宏 ， 
e WIFEXITED(stanusl， 邵 果 地 进程 正常 终 小 就 返回 真 ， 也 就 是 通过 调用 exi 或 者 一 个 返回 
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return ? 

a WEXITSTATUS(stauus): 返 同一 个 正常 终止 的 于 进程 的 退出 状态 。 只 有 在 WIFEXITED 退 问 
ARSH. Аж УА ТАЗ. 

° WIFSIGNALED(status): n5 RE IN А ААВ КНЕ m Г БИЗНЕСІ, ABA gos] 
н ORHES8S 节 中 解释 说 明 信 导 )。 

• WTERMSIG(status): 返回 引起 子 进 程 终 帆 的 信号 的 数量 。 只 有 在 WIFSIGNALED(status)iE 
Я, Т ХАК. 

4 WIFSTOPPED(status): ШЕСІ ЕНІН TERES Rr РЕ), 35 ЖАНИ. 

。 WSTOPSIG(status): 返回 引起 亲 进 程 暂停 的 信号 的 数量 。 民 有 在 WIFSTOPPED (status) Ж 
НЕМ, AE XXX PIS. 


错误 条 件 
旭 果 调用 进程 没有 和子 进 程 ， 埋 各 waitpid 14-1, #39 8 еппо 为 ECHILD. ШЖ waitpid Ж 


数 被 Aii ehe, WATA- Я 8 emo 为 EINTR。 
ӛзі, 和 Unix 和 函数 相关 的 常量 


8 WNOHANG 和 WUNTRACED 这 样 的 常理 是 由 系统 式 文 件 定义 的 ， 例 如 ，WNOHANG 和 


WUNTRACED 是 由 wath 基文 忻 Cini ) 定义 的 : 


/* Bits in the third argument to 'waibpid'. */ 
fdefline WNOHANG 1 /* Don't block waiting. */ 
define WUNTRACED 2 /* Report status of stopped children. */ 


为 了 使 用 这 些 常量 ， 你 党 须 在 你 的 代码 中 包含 wath 头 文件 : 


+#include «sys/wait.h» 


每 个 Unix КЕ man É Si T Ж,Б РГЕ Ж КАЙ} EH АЛЕ к. FI. 


为 了 检查 诸如 了 BCHILD 和 EINTR ЖЕМЕ, 4924 0,4 ernoh， 为 了 篇 化 我 们 的 代码 示例 ， 
我 们 包含 了 一 个 种 为 csapp.h AAL, CRETAE TEADH DRAAI., HRB PAE 
了 сзаррһ X X ff, 


示例 
图 8.15 展示 了 :个 创建 N 个 了 进程 的 程序 ， 使 用 waitpid 等 竺 它们 终止 ， 然 后 全 看 每 个 终 由 了 了 


进 标 的 退出 状态 。 


SRPA Unix Же Бла тах ЕЛЕНУ, ЕРЕ РН: 
unix ./waitpidl 
child 22966 terminated normally with exit status 


child 2296" terminated normally with exit status = 10 


code/ecf/wattpid І.с 
rinclude "csapp.h" 
fdefine N 2 


int maini) 


| 


—) rn in 4m Іт JL 


сп 


异常 控制 流 


int status, 1; 
pid t pid; 


far ti = O; i < N: i++] 
if (ipid = Fork()) == 0) /* child */ 
ехіті106041); 


/* parent waits for all of its children to terminate */ 
while іірій = waitpidí-l1, status, 0!) > Q) 
if (WIFEXITEDistatus)] 


i 
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printfí("child %4 terminated normally with exit statjszt*dMn", 


pid, WEXITSTATUS(status!]; 
alse 


orintfíi"child #9 terminated abnormallyn", pid); 


] 
itf {еггпо !- ECHILD) 
unix errorí("waitpid error"); 


exiti(iüd): 


8.15 使 用 waitpid 函数 回收 僵 死 子 进程 


#include "csapp.h" 
#деТ1пє N 2 


int maini) 


| 


int status, 1; 
pid і pid(N«11!, retpid: 


tor {i = D; 1 < N: 1++] 
if ¿(pid[i] = Fork()) == 0) /* child */ 
екіні100-і); 


/* parent reaps М children in order */ 

i = 0; 

whi.e {(ге-р1а = waitpidipid[i++], &status, 
if :iWIFEXITEDiStartus!) 


09 


>й} 


code/ecffwaitpidl].c 


code/zecfiwaitpid2.c 


[ 


orintfí("child $d terminated normally with exit status-£dn', 


retpid, WEXITSTATUS(status)); 
else 


printf("child $d terminated abnormallyXn", retpid); 
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23 /* The only normal termination is if there are no more children %/ 
2d if (errno !- ECHILD! 
25 unix errorí("waitpid error"); 
26 
27 ехіі iD); 
28 | 
= code/ecf/waitpid2.c 


ІН 8.16 A waltpic 按照 便 死 子 进程 创建 的 顺序 回收 它们 
注意 ， 程 序 不 会 按照 某 种 特殊 的 顺序 回 松子 进程 ， 图 8.16 展示 了 我 们 可 以 如 何 用 waitpid $8 


父 进程 创建 子 进程 的 相同 顺序 来 回收 图 8.15 中 的 子 进程 。 





练习 题 8.4 
考虑 下 面 的 程序 ， 
1 finclude "csapp.h" 
2 
3 int maini} 
4 1 
5 int status; 
6 pid t pid; 
j 
8 printf!i"Helloin"); 
9 pid = Forki}; 
10 printfí("$din", !pid); 
11 1Í ipid != 0) 1 
12 if o(waltpid(-1, status, 0) > 0) 
1:3 if (WIFEXITEDIStatus) l= Q) 
14 ргїпїї{"%Д\п", WEXITSTATUS (status) y; 
15 ) 
16 ) 
7 prlintf("BysexTn"]; 
18 exit (2); 
13 





A. IE E 5+ ФУ? 
B. 这 些 输 出 行 的 一 种 可 能 的 顺序 是 慎 么 ? 


8.44 让 进程 体 眼 
sleep 函数 将 - -个 进程 挂 起 - - 段 时 间 ， 


Kinclude <wunistd,h> 


unsigned int sleep(unsigned int secs); 


o cOde/ecf/waitprabl.c 


code/ecffwaitprobl.c 


AE: АҚЫ УН, 
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sleep 返 可 0 《如 果 请 求 的 时 间 量 已 经 到 了 )， 或 者 返回 剩 下 的 要 休 乳 的 秒 数 。 后 一 种 情况 是 可 
能 的 ， 例 如 当 sleep 贸 数 被 一 个 信号 中 渐 过 早 返 回 时 。 我 们 将 在 85 节 中 详细 讨论 信号 。 

我 们 发 现 很 有 用 的 男 一 个 明 数 是 pause 函数 ， 该 函数 让 调用 两 数 休 上 肪 ， 直 到 该 进 程 收 到 一 个 信 
号 为 止 。 


Kinclude <unistd.h> 


int pausetvoid); 
总 是 返回 -1。 
5 8.5 
编写 一 个 sleep 698,3: k. "Ч snooze， 带 有 下 面 的 接口 : 
unsigned int snoozeiunsigned int secs); 


snooze ЖЖЖ sleep tfi fT RET, RT ЖАТЫ — #15 S. k UESPRE ТЕЖ T £$ K 
时 间 以 外 。 


plepi for а of 5 secs. 


8.45 加载 并 运行 程序 
execve 国 数 在 当前 进程 的 上 下 文中 加 载 并 运行 一 个 新 程序 。 


Binclude <unistd,h> 


int ехесуе (сһаг *Iilename, char *argv[], char *envp); 


车 成 功 则 不 返回 ， 若 错误 则 返回 -1， 





execve 牙 数 加 载 并 运行 可 执行 月 标 文件 flename， 昌 带 参 数列 表 атру 和 环境 变 其 列表 envp。 只 
ЯНА, МИ ЖЕН filename, execve 才 会 返回 到 调用 程序 、 所 以 ， 不 像 fork 会 一 次 调 
HREAN. execve 调用 一 次 并 从 不 和 返回。 

如 图 8.17 所 小， 参数 列表 是 用 数据 结构 表示 的 。argy 变量 指向 一 个 以 pull 结尾 竟 措 针 数 组 ， 其 
中 每 个 指针 都 指 问 一 个 参数 串 。 按 照 习俗 ，argy[0j 是 可 执行 日 标 交 件 的 和 名字。 环境 变量 的 列表 是 由 
一 个 类 似 的 数 撕 结构 表示 的 ， 如 图 8.18 所 示 。envp 变量 指向 一 个 以 null 结尾 的 指针 数组 ， 其 中 每 
个 指针 指 同 一 个 环境 变 最 串 ， 其 中 每 个 中部 是 形 如 “NAME=VALUE” 的 名 字 一 值 对 。 

argy [} 
YY 


argv [arge — 1] 


NULL ^ /uger / include" 





ЮЩ817 参数 列表 的 组 织 结构 


АҒ execve 加 载 了 filename 之 后 ， 它 调用 7.9 节 中 描述 的 启动 代码 。 和 启动 代码 准备 好 栈 ， 并 将 扩 
制 传递 给 新 程序 的 主 函数 ， 该 主 半数 有 如 下 形式 的 原型 : 
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int mainíint агас. char **argv, char **епхуо); 
或 者 等 价 的 ， 
int main[int ағас, char *агцу[], char *епур|]}; 


anvpí] 





-- -一 一 一 一 
| envp — ervpi 0] "PHD= /nsridroh™" 


envp 1] -— 一 一 一 
- "BARINTER-iron" 


in-1] ^: 
ra -— 
| "USER-droh ' | 


图 8.18 环境 变量 列表 的 组 织 结构 


当 main 开始 在 -个 Linux ЖЖ ЕТИ. HIP iE n 8.19 PRAHA, RIMER O 
Ші ЕМ СЕЙ), КЖ OB. НАЛЬ ТУЯНА, vA E EE ВЕ, 
—^B-—^ RADR. EELS, АВНЕ СЛ В, ЖИ null EAER АН. ҖЕ ТЕА 
指向 栈 中 的 个 环境 变量 内。 全 局 变量 environ EaR STRE EIAS —1° епур(0]. KHARE 
组 其 后 的 是 以 null ЖЖ) argv[ ] 数 组 ， 其 中 每 个 元 素 都 指 辣 栈 中 一 -个 参数 溃 。 在 栈 的 顶部 是 main 
PF ERES] 3 个 参数 ， envp， 它 指向 envp[ 121; argv, IE] argv[ ] 数 组 : atgc， 它 给 出 argvt ] 中 非 空 
指针 的 数量 ，。 









ÜOxofffffff| C —— БЕН 
HÀ null £& FE а: 


El nul £; E dg ЭТ 参数 中 


етл [r] = 


envp[n- 1] 


4-: 








| environ | 


а argv[argc]-^ NULL 


агау (агас — 1] 





э] БЕ ЖЕЛШ 
: enu P 
7 
агас 
Üxbf££faT7r l 
) main НЕМ 
| FE i 


图 8.1? 当 一 个 新 的 程序 开始 时 ， 用 户 栈 的 典型 组 织 
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Unix 提供 了 几 个 函数 来 操作 环境 数组 ， 


$include «stdlib.h» 


char *getenví(const char *name!); 


返回 ; 若 丰 在 则 为 指向 名 字 的 指针 ， 著 无 匹配 的 ， 划 为 NULL. 


getenv 函数 在 环境 数组 中 搜索 字符 串 “name<=value”， 如 果 找 到 了 ， 它 就 返回 一 个 指向 value 的 
ІН. ЖЫ 5 EIE RI 


#include «stdlib.h- 


int setenv (gonst char *name, const char *newvalue, int overwrite); 


KA: X m358525 0, ， 藻 错误 则 为 -1， 


void unsetenv(congst char *name); 





ik. X. 


В А "МЕ “пате=оМуаше” КЕЗЕН, 那么 unsetenv zz Bl E. IHJ setenv 会 
用 newvalue 代替 oldvalue, RER K E overwine 非 零 时 才 会 这 样 。 如 果 name PFE., WA setenv 
就 把 “name=newyvalue” 添 加 到 数组 中 ， 


Si. Æ Solais КЮ ТИШИНЕ 
Solaris 提供 putenv БЖ, ЖЖ setenv АЙ, EIE MEBUI B T unsetenv ЖЖ ЙК АШ. 


өз. Sup 

ШЖ Tit 563623, ЖТА, ЯЖА-ТЕХАФЯНТЯАРФАЯ-ЫНҢАН, RUE AS 
REM S 4s А ЧГ АЕ D ÉE YD S ТЕЖЕ, AFARA TRETA, BAER F 
ВАЛУ; ЯЛЯЕДаАНжЕЛЛЯН АТА, Н fork execve 函数 ， 
SE A dE POETE E85, fork dc Rare TIR Pi Hj КЕЛЬ, IECUR Y Hi 
Xd. execve dd E EARDELETE ФЕТЕЛА. ЕЕ n É 5 W dt 603 h S 
B|, B HRA ЛЕ, МАНДА PD, 7FEMOCK T JUS execve Шат 
ПИЖЕШ. | 


5 3M 565 
编写 一 个 叫做 myecho JR, edTfpis'e ager pi 3k ie PR Y. d: 


nix» ./myvecho argl ага? 
Command line arguments: 
аүсу[ 01: myecho 
argv[ 1]: argl 
argv[ 2]: arg2 
Environment variables: 
envp[ 9]: PWDz/usrO/droh/ics/code/ec* 
envp[ 1]: TERM-emacs 
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епур[25]: USER=droh 
envp[26]: SHELL-/usr/lozal/bin/tcsh 
епурі27і: HOME-/usrÜü/droh 


8.4.6 IH fork 和 execve 运行 程序 

R Unix shell 和 Web 服务 器 《第 12 章 ) 这 样 的 程序 大 量 使 用 了 fork 和 execve В. shell 是 - 
个 下 互 型 物 应 用 变 程 序 ， 它 代表 用 户 运行 其 他 程序 。 最 早 的 shell 是 sh 程序 ， 后 面 出 现 了 一 些 宏 种 ， 
比如 сәһ. tesh, ksh 和 bash。shell 执行 一 系列 的 读 / 求 值 (read/evaluate) Б, ЖЕЖ. ЖЗНЕ 
读 取 来 日 用 户 的 一 个 命令 行 。 求 值 步 又 解析 命令 行 ， 并 代表 用 户 运 行程 序 。 

图 8.20 展示 了 个 简单 shell 的 main 例 程 。shell 打印 一 个 命令 行 提示 符 ， 等 竺 用 户 在 stdin 上 
输入 命令 行 ， 然 后 求 值 (evaluate》 这 个 命令 行 。 








code/ecffshellex.c 
1 include "csapp.h" 
2 #define MAXARGS 128 
3 
4 /* function prototypes */ 
5 vold evalichar *cmdline); 
6 int parseline(const char *cmdline, char **arqv); 
7 int builtin, command(char **argvi; 
8 
9 int maini) 
0 ( 
11 char cmdline[MAXLINE]; #* command line */ 
12 
13 while (1) I 
14 /* read */ 
15 printfí"» "}; 
16 Fgets(cmdline, MAXLINE, бейіп); 
17 if (feofístdin!) 
18 exití(0); 
13 
20 /* evaluate */ 
21 evallcmdline); 
22 ] 
23 | 
code/ecf/shellex.c 


8]8.20 一 个 简单 shel 程序 的 main 例 程 


% 821 展示 了 求 值 Cevaluate ) 命令 行 的 代码 。 它 的 第 一 个 任务 是 调用 parseline 少数 (图 8.22), 
这 个 浊 煞 解析 了 以 空格 分 隔 的 命令 行 参 数 ， 并 构造 最 终 会 传递 给 execve 的 ару 向 量 。 第 --- 个 参数 
COLE RES WB shell 命令 名 字 , 马上 就 会 解释 这 个 命令 , 归 么 是 一 个 可 执行 的 日 标 文件 ， 
会 在 一 个 新 的 了 进程 的 上 下 文中 加 载 并 运行 这 个 文件 ， 








code/ecffshellex.c 
1 {* eval - evaluate a command line */ 


2 void evalíchar *cemdliae! 


гә —3 гт, їл Æ ra 


L3 > ке кмк, P= = = = к> Мб 
мз D —I із ӧл e d B3 Loc 


BR B BR BO 
м M Ға CO 


AX ba BO 
C л ы» 


бы D RO BI b Ёё 
— > мт do — 


32 
33 
34 
35 
35 
37 
38 
39 
40 
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{ 
char *argv[MAXARGS]; — f* arev for execve() */ 
int bg; /* should the job run in bg or fg? */ 
pid t pid; /* process id */ 
bg = parseline(cmdline, argv}; 
if largv[9] == NULL! 
return; /* ignore empty lines */ 
іс (!builtin сстмала (агач) ) ( 
12 ((pid = Fork()) == 0) t /*child runs user job */ 

15 (execve[argv[0], агач, environ] < 01! 1 
printf("*€s: Command not found. хл", argv[0]); 
ехісій): 

| 
) 
/* parent waits for foreground job to terminate */ 
if (!bg) i 
int status; 
if (waitpidipid, &status, Ü) < 0) 
unix errorí("walbfg: waitpid error"); 
) 
else 
printfí"*d $s", pid, cmdlinel; 
} 
return: 
) 
7* if first arg is a builtin command, run it and return true */ 
int builtin command(char **argv) 
{ 
if (!strcmplargv[O0], "guit")i {* quit command */ 
ех1Ё {0}; 
if (!strcmp(argv[0], "&")) 1% ignore singleton & */ 
return 1; 
return 0: № not a builtin command */ 
) 
code/ecfishellex.c 
61 8.21 eval: ЖЕ (evaluate) shell 命令 行 
cade/ecj/shellex.c 


1* parseline - parse the command line and build the argy array */ 

int parselineiconst char *cemdline, char **argv) 

l 
char array [MAXLINE]; /* holds local copy of command line */ 
char *buf - array; /* ptr that traverses command line */ 
char *delim; Ж points to first space delimiter */ 
int arge; /* number of args */ 
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В int bg; 上 background job? */ 

3 

10 ергеру(іші, cmdline); 

11 bufistrlenibuf)-1] = ' '; /*replace trailing ^n’ with space */ 
12 while (*buf && (“БЕ == ' ')) f*ignore leading spaces */ 
13 buf; 

14 

15 /* build the argv list */ 

16 агас = D; 

i7 while ((delim = strchrí(buf, * '))) Í 

18 argv[argc««] = buf; 

19 *delim = 506 

20 buf = delim + 1; 

21 while (*buf аё (*buf == ' ')) /*ignorc spaccs */ 
22 buf--; 

23 } 

24 argviarge] = NULL; 

25 

26 LË {argc == C) /Жірпоге blank line */ 

2) return 1; 

28 

29 {* should the job run іп the background? */ 

30 if ((bg = (*argv[argc-1] == '&')) != 0) 

31 argv[--argc] = NULL; 

32 

3i return bg; 

34 ] 


code/ecf/shellex.c 
ІҢ 8.22 parseline: 为 shell 一 个 输 关 行 

HERE -TERE 1 “&” 字符， 那么 parseline 返回 |， 表示 应 该 在 后 台 执 行 该 程序 (shell 
不 会 等 等 它 完 成 )。 否 则 ， 它 返回 0， 表 示 应 该 在 前 台 执 行 这 个 程序 (shell 会 等 待 它 完成 )。 

TREI I IIR. eval 的 数 调用 builtin_command ЖШ, 该 前 数 检查 第 一 个 命令 行 驳 数 是 省 
是 APRI shell 命令 。 如 果 是 ， 它 就 立即 解释 这 个 命令 ， 并 返回 值 1。 香 则 ， 返 回 0。 我 们 简单 
的 sheli 只 有 -个 内 置 命 令 一 一 quit i$. ӨШӘЖНЖЕІК shell 的 。 实 际 使 用 的 shell 有 大 量 的 合 
4, ДЕШІ pwd, jobs 和 fg. 

如 果 builtin command 返回 0, ЖА shell 创建 一 个 子 进程 ， 并 在 子 进程 中 执行 所 请 求 的 程序 。 
WARA ERTED AET. ЖА. shell 返回 到 循环 的 项 部， 等 待 下 一 个 命令 行 。 省 则 ，shell 
(ЕНІ жанра 函数 等 待 作业 的 终止 。 当 作业 终止 时 ，shell 就 开始 下 一 轮 迁 代 ， 

注意 ,这 个 简单 的 shell 是 有 缺陷 的 ， 因 为 它 并 不 回收 它 的 后 台子 进程 。 企 改 这 个 缺陷 就 蝎 求 使 
用 优 导 ， 我 们 将 在 上 一 节 中 讲述 信和 号 。 
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色目 前 为 十， 在 我 们 对 异常 控制 流 的 学 习 中 ， 我 们 已 经 看 到 了 琵 件 和 软件 旦 如 何 合作 以 提供 基 


本 的 低层 异常 机 制 的 。 


异常 控制 流 


529 


我 们 也 看 到 了 操作 系统 是 如 何 利用 异常 来 支持 更 高 屋 形式 的 异常 控制 流 的 ， 


也 就 是 所 谓 的 上 下 文 切换 。 在 本 节 中 ,我 们 将 研究 一 个 更 高 层 软 件 形式 的 异常 ， 称 为 Unix 159, E 
允许 进程 中 断 其 他 进程 。 


"ЧЕ 5 (signal) && — 


条 消息 ， 它 通知 进程 一 个 某 种 类 型 的 事件 已 经 在 系统 中 发 生 了 。 比 如 ， 
图 8.23 展示 了 Linux 系统 上 支持 的 30 种 不 同类 型 的 信号 。 


ааган TIT 


ч 0b — см М & ы [DO — 


SIGHUP 

SIGINT M 

SIGQUIT A rt 

SIGILL A 

SIGTRAP AEH MTMA Ll) 
SIGABRT АРНЕ (1) 
SIGBUS 终止 

SIGPFE ЖЕЛЕ ИЕА CD 
SIGKILL gi (2) 

SIGUSRI 终止 

SIGSEGV & E TERERE (1) 
SIGUSR2 终止 

SIGPIPE ЖІК 

SIGALRM 
SIGTERM 
SIGSTKFLT 
SIGCHLD 
SIGCONT 
SIGSTOP 
SIGTSTP 
SIGTTIN 
SIGTTOU 
SIGURG 
SIGXCPU 
SIGXFSZ 
SIGVTALRM 
SIGPROF 
SIGWINCH 
SIGEG 
SIGPWR 
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停止 下 到 下 一 个 SIGCONT (2) 
EILERT 个 SIGCONT 
БЕНЖТ -个 SIGCONT 
Ж ЕҤ Т -个 SIOCONT 


5E EEG 

KARAN E 

X E St e PB H 

非法 指令 

距 踪 陷阱 

X Н abort ЖЖМ p TS = 

和 总线 错误 

PF кА 

ARI 

Не АКИ 1 
JE ИА УН (ДШ) 
HF У ВЕЕ 2 

向 — ЖЕН РШ ЕИ SUE 
ЖН alarm ӨЛЕН E (S S 
AK FER IER E 
МЕНЕЕ 

一 个 子 进程 暂停 或 者 终止 

dE SE EP UD CUL ES E 
TK B font) ДЕ 

ЖН ЕЕ BS Ta = 

J BER EE 

Ju E EF п, E ig H 
EEFE SHY 

CPU HHRHH 
EEA АВ EJE Н 
EHE RT ДЕЛА 
ШТ ЕЕ ЖЕЛДЕ 
KORDE 

在 某 个 描述 符 上 可 执行 UO REIR 
电源 故障 


其 他 Unix 系统 是 类 似 的 ,注意 : (DO. 多 年 前 ， 主 存储器 是 用 - 种 称 为 磁 芯 有 有 情 器 《core memory) 的 技术 来 实现 的 .“ 转 健 存 


й (dumping core)" 是 - :个 历史 术语 ， 


不 能 被 忽略 ， 


意思 是 把 代码 和 数据 存储 器 段 的 欧 优 写 到 磁盘 工 。(2) 这 个 信号 多 不 能 被 捕获 ， 也 
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ЗРНА Е рУ ТЕТІК ИСЕ, IEEE PIE ДЕШИ ЕЕЕ ДЕЛА НЕ ЕЈ, Ж 
НРО ЕЕ А. Bs: Г ЛАН ЖЕНЕ ТЕ tE. ШШ, mm - 
个 进程 试图 除 以 9， 那么 内 核 就 发 送 给 它 一 个 SIGFPE 信号 СЫН 8). n А AE 
令 ， 那 么 内 核 就 发 送 给 它 一 个 SIGILL 信号 (号码 4)。 如 果 进 程 有 非法 存储 器 引用 ， 内 核 就 发 送 给 它 
- ^ SIGSEGV 信号 СӘН». АЯМЕЗАМ ТН Ж АЛЕН ЖЕТЕН ЕРМЕ. Қ.Ш. 
如 果 当 进程 三 后 台 运 行 时 ， 你 键入 cul-c (也 就 是 同时 按 下 etrl SERI c 键 )， 那 么 内 核 就 会 发 送 一 -个 
SIGINT 信号 (5&8 20 给 前 全 进程， 一 个 进程 可 以 通过 发 送 一 个 SIGKILL 信号 (号码 9) 强制 终止 
另外 一 个 进程 , 当 一 个 子 进 程 终 小 或 者 暂停 时 ， 内 核 会 发 送 一 个 SIGCHLD fi CS 83 17) Ж ER. 


8.5.1 信号 术语 
传送 一 个 信号 到 日 的 进程 是 由 两 个 不 同步 骤 组 成 的 ; 
. 发 送信 号 , 内 核 通过 更 新 吕 鸣 进程 上 下 文中 的 某 个 状态 , 发 送 ( 递 送 ) 一 个 信号 给 日 的 进程 。 
AA v up ELE A FARREA: 全 内 核 检测 到 一 个 系统 事件 ， 比 如 除雪 错误 或 者 子 进 程 络 
I; 凶 - -个 进程 调用 了 kub AX СЕК - 节 中 讨论 )， 显 式 地 要 求 内 核发 送 一 个 信号 给 日 的 
进程 。 ЕТИБ АЕ Нс. 
о 接收 信号。 BIS ЖЕРІ НДА Xd GAIA BRI. НМ ИЫ / 
信号 。 进程 可 以 忽略 这 个 信和 号, Бары, 或 者 通过 执行 一 个 称 为 信号 处 理 程序 (signal handler) 
HA PEE OT IB. 

-ARRETRARE s nd АРА TE S). (pending signal). 在 任何 时 刻 ， 32€ 4: 5 
只 会 有 一 个 待 处 理 信 号 ， 如 果 -个 进程 有 一 个 类 型 为 上 的 竺 处理 信 号 ， 那 各 任何 接 下 来 发 送 到 这 全 
进程 的 区 起 为 上 的 入 号 都 不 会 排队 等 待 ， 它 们 只 是 被 简单 地 丢弃 。 一 个 进程 可 以 有 选择 性 地 阻塞 接 
收 革 种 信号 。 当 一 种 信号 被 阻塞 时 ， 它 仍 可 以 被 发 送 ， 但 是 产生 的 竺 处 理 信 号 不 会 被 接收 ， 和 直到 进 
程 取消 对 这 种 信号 的 阻塞 ， 

个 等 处 理 信 号 最 多 只 能 被 接收 次。 内核 为 每 个 进程 在 pending 位 向 量 中 维护 着 待 处 理 信和 号 
Жа, ME blocked 位 向 量 中 维护 着 被 阻塞 的 信号 集合 。 只 要 一 -个 类 型 为 的 信号 被 传送 ， 内 核 就 
"fF pending 位 加 其 中 设置 第 丰 个 位 ， 而 只 婴 一 个 类 型 为 k BO ERO. P ECC ZEE pengding 位 
问 量 中 清除 第 个体。 


852 发 送信 号 

Unix 系统 提供 了 大 量 的 机 制 ， 用 来 发 送信 号 纵 进 程 。 所 有 这 些 机 制 都 是 基于 进程 组 (process 
group】 这 个 概念 的 。 

进程 组 

每 个 进程 部 只 属于 -个 进程 组 ， 进 程 组 是 由 一 个 正 整 数 进程 组 ID 来 标识 的 。getpgmp AROK IE 
ANEMIAA ID: 


finclude «unistd.h- 


pid t getnpgrpivoid); 





返回 : 调用 进程 的 进程 组 ID, 
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САН, — 4 FXERERUE УЗСА Е АА Т -个 进程 组 。 一 个 进程 可 以 通过 使 用 setpgid ЖД ЖЕН 
变 自己 或 者 其 他 进程 的 进程 组 : 


#include «unistd.h-» 


pid t setpgid(pid t pid, pid t pgid); 


БЕ: ERANI ЖКА 9-І. 





setpgid ЖЕЛЕ pid 的 进程 组 改 为 pgid。 WÈ pid 是 0, ЖЛ ТЕН УНГЕ РО. ШЖ pgid 
是 和， 那么 就 用 pid 指定 的 进程 的 PID 作为 进程 组 ID. 例如， 如 果 进 程 15213 是 调用 进程 ， 那 么 

setpgid(0, 0}; 

会 创建 一 个 新 的 进程 组 ， 其 进程 组 ID 是 15213， 并 县 把 进程 15213 加 入 到 这 个 新 的 进程 组 中 。 

用 kill 程序 发 送信 号 

/bin/kill 程序 可 以 向 男 外 网 进程 发 送 任 意 的 信号 。 比 如， 命令 

unix- kill .9 15213 
发 送信 号 9 (SIGKILL) 给 进程 15213。 一 个 为 负 的 PD 会 导致 信号 被 发 送 到 PID 进程 组 中 的 每 个 
dE. Ші, d$ 

unix» kill .9 ‚152123 
发 送 一 个 SIGKILL 傅 号 给 进程 组 15213 中 的 每 个 进程 。 

B SCRI 

Unix shell 使 用 作业 【job )] 的 抽象 概念 来 表示 求 值 Cevaluating ) 一 条 命令 行 而 产生 的 进程 。 在 
任何 时 刻 ， 双 多 只 有 一 个 前 台 作 业 和 口 个 或 多 个 后 台 作 业 。 比 如 ， 键 入 

unix» Із | sort 
创建 -- 个 由 阅 个 进程 组 成 的 前 台 作 业 ， 这 两 个 进程 是 通过 Unix 管道 连接 起 来 的 ;一 个 进程 运行 ds 
程序 ， 另 一 个 运行 sort 程序 。 

shell 为 每 个 作业 创建 一 个 独立 的 进程 组 。 典 型 籽 ， 进 程 组 ID 是 取 自 作业 中 改进 程 中 的 一 个 。 
比如 ， 图 8.24 展示 了 -“ 个 有 一 个 前 台 作 业 和 两 个 后 全 作业 的 shell, 前 台 作 业 中 的 父 进 程 FID 为 20, 
进程 组 ID 也 为 0。 父 进程 创建 两 个 子 进 程 ， 每 个 也 都 是 进程 组 20 的 成 员 。 

在 键盘 上 输入 ctrl-c， 发 送 SIGINT 信号 到 shell. shell 捕获 该 信号 【参见 8.5.3 节 )， 然 后 发 送 
SIGINT 信号 到 这 个 前 台 进 程 组 中 的 每 个 进程 。 在 默认 情况 中 ， 结 果 是 终止 前 台 作 业 。 类似 地 ， 输 
A ctrl- 会 发 送 一 个 SIGTSTP 信号 到 shell. shell 捕获 这 个 信和 号， 并 发 送 SIGTSTP 信和 号 给 前 台 进 程 
组 中 的 每 个 进程 。 在 默认 情况 下 ， 结 果 是 暂停 GERD 前 台 作 业 。 

用 kill 65 

进程 通过 调用 kill 阔 数 发 送信 号 给 其 他 进程 《包括 它们 自己 ); 


"include «sys/types.h» 
#include «signal.h- 


int kililpid t pid, int sig}; 





i. EAHA 0. XE S -1. 
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X 


- 


| рій 20 


| атаа | | x пеня) | pid-312 | EST | pid-40 
: ri / Я] i pgid-i2 | #2 | Pgidcap 
| | L. R v i | NM T. i 

ЛҮ / N : 所 台 进 程 组 32 丰台 进程 组 A0 

; k : 

FER | МЛ 

Н _/ : 

pid-21 pid=? 

Bane man pgid 20 | ER127 20 — 
НІ & ЖН 20 


824 前 台 和 后 台 进 程 组 
ижрат, WA Kill 函数 发 送信 号 号 码 sig 给 进程 pid, 如果 pid FE, ЖА кш 发 送信 
号 sig 给 进程 组 abstpid) 中 的 每 个 进程 。 [8 8.25 展示 了 一 个 示例 , ЖЕЛШ КШ ЖК ПЕ SIGKILL 
HEA eR THE. 
Uomo eodefecf/kil.c 





1 kinclude "cgsapp.h" 
ғ 
3 irt malni) 
4 { 
5 pid t pid; 
b 
7 /* child sleeps until SIGKILL signal received, then dies */ 
8 if (ipid = Fork()) == 0) í 
3 -ause(); /* watfora signal to arrive */ 
10 orintf(*control should never reach here!in"]; 
11 exit {0}; 
12 ] 
13 
14 {* parent sends а SIGKILL signal to a child */ 
15 Killipid, SIGKILL)!; 
16 ex1t'D); 
1? ) 
code/ecf/kili.c 
8.25 ТЕН kil AAE 5 8-Е 
Hl alarm Р КЕДЕ 


Жен GORG WFH alarm AAEE Н OR IE SIGALRM 信和 号， 
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Kinclude «unistó.h- 
| 


unsigned int alarmíunsigned int secs); 
i£]; А-К epe e В, ЖАНИЯ ЖАР, m» o. 

alarm AA ОЯНА EE secs 种 内 发 送 一 个 SIGALRM 信 身 给 调用 进程 。 如 果 secs EF, БАЛ 
会 调度 新 的 闹钟 (alarm)。 在 任何 情况 中 ， 对 alarm 的 调用 都 将 取消 任何 待 处 理 的 《pending) Е, 
并 月 返回 任何 待 处 理 的 闭 钟 应 该 发 送 前 剩 下 的 秘 数 (如果 这 沈 对 alarm 的 调用 没有 下 消 它 的 话 )， 或 
者 如 果 没有 和 任何 待 处 理 的 闹钟 ， 就 返回 零 。 

图 8.26 展示 了 了- -个 调用 alarm 的 程序 ， 它 安排 日 己 被 SIGALRM 信号 在 5 秒 内 每 种 中 断 一 次 。 
当 传 送 第 6 个 SIGALRM EE, TAZE. 


coderecfhralarm.c 


1 4include "csapp.h" 

2 

3 void handle-íint 819) 

4 1 

5 static int beeps = 0; 

5 

7 printf {"ВЕЕР\п"); 

8 if t++beeps < 5) 

9 А1агт{1); /* next SIGALRM will be delivered in 1s */ 
10 else { 

ll printf("BOOMIn"]: 

12 exit (0); 

13 JƏ 

14 ! 

15 

16 int та1п{) 

17 I 

18 Signali SIGALEM, handleri; # install SIGALRM handler *; 
13 Alarm(1); /* next SIGALRM will be delivered in 1s */ 
28 

21 while 11) 1 

22 ; #* signal handler returns control here each time */ 
23 } 

24 exitiD); 

25 ) 


code/ecffalarm.e 
к 8.25 A alarm ER Erf fe Rate a fk 


当 我 们 运行 图 8.26 中 的 程序 时 ， 我 们 得 到 以 下 的 输出 ，5 ИЮ “ВЕЕР”, АШИ 
程序 终止 时 的 一 个 “BOOM ”: 


unix» ‚/а1агт 
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ВЕЕР 
ВЕЕР 
ВЕЕР 
ВЕЕР 
ЕЕЕР 
BUOM ! 


HEX 826 中 网 程 序 使 用 signal AARE J - -个 情 号 处 理 函 数 (handler), PERERA -个 
SIGALRM 信号 ， 就 异步 地 调用 该 函数 ,中 断 main 程序 中 的 无 限 while 循环 。 当 handler 返回 时 ， 控 
БИЕ [n] main 函数 , 它 藉 从 当初 被 信和 与 到 达 时 中 断 了 的 地 方 继续 执行 , 访 置 和 使 用 全 号 处 理 程序 可 
能 是 相当 微妙 的 ， 这 将 是 下 面 三 节 讨 论 的 主题 。 


853 ”接收 信号 

HARA ЛЕДЕ. ЖЖ ИЕШЕ А р. КСР ЖКП ЗЕНИТ АНИ 
FAIRG (pending& blocked)。 如 果 这 个 集合 为 空 ОНЫН), MARRE HS DEI 
制 流 中 的 十 一 条 指令 (jem)。 

然而 ， 如 果 集 合 是 非 空 的 ， 那 么 内 核 选择 集合 中 的 某 个 信号 (通常 是 最 小 的 ky, ЗРНА p 
RU у k 慑 天 这 个 入 号 会 触发 进程 的 某 种 行为 ,一 已 进程 完成 了 这 个 行为 ， 那么 控制 就 传递 加 | р 
的 过 辑 控制 流 中 的 上 -条 指令 (now}。 每 个 信 与 类 型 者 有 -个 预定 义 的 默认 行为 ， 

* HERE. 

. XUEEEE ИТЕ ЛА sn (dump core). 

. 进程 暂停 二 到 被 SIGCONT 信和 号 重 局 。 

€ ЖЕЛ TS S. 

8 8.23 ERI k МЕН ХАН ВКА Эу. КШ, КЗ SIGKILL ЧАТ АНД ДЕЕ: 
REE. $55 ЖҚ SIGCHLD 的 默认 行为 就 是 忽 赂 这 个 信号 。 进 程 可 以 通过 使 用 signal ЖЕ 
改 相 人 情 号 相关 联 的 黑 认 行为 。 惟 一 的 例外 是 SIGSTOP 和 SIGKILL， 它 们 的 默认 行为 是 不 能 收 改 的 。 

#include «signal,h» 
typedef void handlers tíint) 


handler t *signalíint signum, handler, t *handler) 


iR). ЖААТ АЁ PR E P. ast. ЖЩ X SIG-ERR 不 设置 ermo. 





signal ЮЖН РА РУ А 2 ЖӘНЕ signum 相关 联 的 行为 : 

• MMR handler 是 SIG_IGN， 那 么 忽略 类 型 为 signum 的 信和 号。 

• MH handler 是 SIG_DFL， 那 么 类 型 为 signum 的 信号 行为 恢复 为 默认 行为 。 

* HU, handler 就 是 用 户 定义 的 函数 的 地 址 ， 称 为 信号 处 理 程 订 (signal handier). АЖИ 
接收 到 一 个 类 型 为 signum 的 信号 , 就 会 调用 这 个 程序 , 通过 把 处 型 程序 的 地 址 传递 到 siena 
明 数 从 而 改变 默认 行为 ， 这 也 收 设置 迟 号 处 理 程 序 。 信 号 处 理 程 序 的 油 用 被 称 为 捕 揽 信号， 
依 号 处 理 程 序 的 执行 被 称 为 处 理 信 向 。 

H 个 进程 精 提 了 一 个 类 型 为 上 的 信号 时 ， 为 信号 天 设置 的 处 理 程序 被 调用 ， 同 财 惟 -一 一 个 回 

数 参 数 被 设置 为 上 ， 这 个 参数 允许 同一 个 处 理 效 数 捕 挫 林 同 类 型 的 信号， 
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当 处 理 程 序 执行 它 的 тїшї 语 名 时， 控制 〈 通 常 》 传递 回 控 制 流 中 进程 被 信号 接收 中 断 位 置 处 
的 指令 。 我 们 说 “通常 ”是 因为 在 某 些 系统 中 ， 被 中 断 的 系统 调用 会 并 邑人 返回 一 个 错误 。 

图 827 展示 了 一 个 捕获 用 户 在 键盘 上 输入 etrl-e 时 shell 发 送 的 SIGINT 信和 号 的 程序 。SIGINT 
的 默认 行为 是 立即 终止 该 进程 。 在 这 个 示例 中 ， 我 们 将 默认 行为 修改 为 捕 提 信号 ， 输 出 一 条 信息 ， 
然后 终 LEER. 


code/ecf/sigintl.c 
1 kinclude "csapp.h" 
2 
3 void handierí(int sig) /* SIGINT handler */ 
4 i 
5 printf "Caught SIGINTAn'); 
6 exitii); 
р } 
8 
9 int maini) 
10 1 
11 /* Install the SIGINT handler */ 
12 if íslgnal(SIGINT, handler) == SIG ERR) 
13 unix error("slgnal error"); 
14 
15 pause(); /* wait for the receipt of a signal */ 
16 
17 exitio); 
18 ) 
code/ecf/sigintl.c 


图 827 —" 5i SIGNT 信和 号 的 程序 
ЖИЛЕ ЖЕ ХЕЗ 3~? 行 中 。 主 函数 在 第 12 一 13 行 设置 处 理 程 弃 ， 然 后 进入 休眠 状态 ， 


直到 埃 收 到 -一 个 信号 (第 15 行 )。 当 收 到 SIGINT 信号 时 , 运行 处 理 程序 ,输出 一 条 信息 (第 5 行 )， 
热 后 终止 这 个 进 各 【第 6 行 }。 


练习 是 8.7 
编号 一 个 叫做 snooze 的 程序 ， 有 一 个 命令 行 参数 ， 用 这 个 参 教 调用 习题 8 中 的 snooze 函 教 ， 
然后 终止 .编写 程序 ， 使 得 用 户 相 以 通过 在 外 和 坦 上 输入 etrl-e 中 断 snooze Ж, Боп. 


unix» ./snooze 5 


Slept for 3 of 5 secs. User hits crtl-c after 3 seconds 
unix» 


8.5.4 ”信号 处 理 问 题 

对 于 只 捕 提 -- 个 信号 并 终止 的 程序 来 说 ， 信 号 处 理 是 简单 直接 的 。 然 而 ， 当 一 个 程序 要 捕 提 多 
个 信号 时 ， 一 些 细微 的 问题 就 产生 了 ， 

€ ҚАЗАН Ж. Unix. 信和 号 处 理 程序 典型 地 会 阻塞 当前 处 理 程序 正在 处 理 的 类 型 的 待 处 
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Zak 


Bes. a. Gue—TxtEBEI—TSIGINT 信号 ， 并 且 当 前 正在 运 行 它 的 SIGINT 处 
ЖЕР. ШАН 个 SIGINT Aa ERRARE, WARA SIGINT ЕТЕ, fH 
是 不 会 被 接收 ， 自 到 处 理 程序 返回 。 

待 处 理 信号 不 会 排队 等 待 .任意 类 型 至 多 只 有 一 个 待 处 理 信和 导 ,. 因此 ， 如 果 有 两 个 类 型 为 上 
的 信号 传送 划一 个 只 网 进程 ， 而 由 于 日 的 进程 当前 正在 执行 依 号 大 的 处 理 程序 ， 所 以 依 号 大 
号 阴 塞 的 ， 那 么 第 二 个 信号 就 被 简单 地 持 奔 ， 它 不 会 排队 等 车， 关键 思想 是 在 在 一 个 行 处 
FEES CER] & v psu Т аи 

ЛАЛА ДГ КАЧ EE. HR read. write 和 accept ХАЯА А Р-Н 
КЕНЕН, FEARR ДААА. ЯНКИ, SRE Ta МЕСЕ, ah 
ЖИЦИ s ge BB PE РЕЈА ЧН АЖА, MERR АН TBA er ЛЖ 
errno tx 8.2 EINTR. 


让 我 们 利用 一 个 简单 的 应 用 程序 更 深入 地 看 看 信号 处 理 的 细微 之 处 ， 这 个 应 用 程序 本 质 上 类 似 


T shell 和 Web ҒАН ҚЫҢ ЖЕР. 基本 的 结构 是 一 个 父 进 程 创 建 一 些 子 进程 ， 这 些 子 进程 独 
让 这 行 一 会 儿 ， 然 后 终止 。 父 进程 必须 回收 子 进 程 ， 以 避免 在 系统 中 饼 下 怪 死 进程 ， 亿 是 我 们 也 想 
让 贫 进 程 在 子 进 程 运 行 时 开 以 只 由 地 做 其 他 工作 ， 所 以 ， 我 们 疾 定 用 SIGCHLD ЖЕРІН [F3 
Е, Л КЕ ГНН Е, (回想 一 下 内 要 子 进程 终止 域 首 暂 停 时 ， 内 核 就 低 发 送 一 个 
SIGCHLD 信号 给 父 进程 。) 


Z 828 展 水 了 我 们 的 第 一 次 尝试 。 父 进程 设置 了 一 个 SIGCHLD ЖКН, АЛШ / ОА Y 


进 种 ， 其 中 每 个 了 进程 运行 1 秒 ， 然 后 终止 ， 同 时 ， 父 进程 等 待 来 白 终 端的 “个 输入 行 ， 随 后 处 型 
它 。 这 个 处 型 被 横 型 化 为 一 个 大 限 循环 。 当 每 个 子 进 程 终 止 时 ， 内 核 通过 发 送 一 个 SIGCHLD 信号 
通知 芝 进 程 。 父 进程 捕捉 这 个 SIGCHLD 信 导 ， 回 收 一 个 子 进程 ， 短 一 些 其 他 的 清除 工作 【模型 化 
为 sleep(2) 语 名 )， 然 后 退回。 


cade/ecf/signall.c 
"include "csapp.h" 


void handlerlí(:nt sig! 
l 
21d L pid; 


if 1 (pid = waitpid(-1, NULL, 91) < 0) 

unix errorí("waitold error"); 
printf("Handler reaped child $&din", iint)pid); 
SleepiZ): 
return; 


; 


int mainí) 
{ 
int 1, n; 
char buf [MAXBUF] ; 
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18 
19 ІР (signal(SIGCHLD, handlerl) == SIG ERR) 
20 unix errorí"signal error"); 
21 
22 /* parent creates children */ 
22 for {1 =й; 1 < 3; l++) Í 
2 if (Forx() == 0) { 
25 printfi"Hello from child *%ásxn", (int)getpid(]); 
26 51еер(2}; 
7 exitio; 
28 ) 
25 ] 
30 
31 {* parent waits for terminal іпри and then processes it */ 
32 11 iin = read(STD-MN_FILENO, buf, sizeof(buf))) < 0) 
33 unix еггогі"”каай"); 
34 
35 printfi"Parent processing inputin"); 
36 while 11) 
37 ; 
3g 
39 exit {0}; 
40 } 





code/ecf/signali.c 


Ей 8,28 signal 
Ж ЕНГЕН АКАНИН, Pla kipka S BUE. {Хы НА ЕЖЕН ТЫ MR eh 。 


А 828 中 的 sgnall 程序 看 起 来 相当 简单 。 然 而 ， 当 我 们 在 Linux 系统 上 运行 它 时 ， 我 们 得 到 
如 下 输出 ， 


1inux» ./signall 

Hello from chiid 10320 
Hello from child 10371 
Hello from child 10322 
Handler reaped child 10320 
Handler reaped child 10322 
ccr» 


Parent processing input 

从 输出 中 ， 我 们 注意 到 ， 尽 管 发 送 了 3 个 SIGCHLD (882 utE, НЕНЯЯЗӘВЯ ЧЕН 
被 接收 了 ， 因 此 父 进程 只 是 回收 了 两 个 子 进程 。 如 果 我 们 挂 起 父 进程 ， 我 们 看 到 ， 实 际 上 ， 子 进程 
10321 ЯНК, В Г ЕНН. 


ectri-z» 
Suspended 
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linux- ps 
PID TTY STAT TIME COMMAND 


10319 ро T (;03 signall 


10221 ро“ 0:00 isignaell «zombie») 
10323 p5 F 0:00 ps 


WES HIE ТЕ? МӘЛЕ BOB ERES РАЗА НЕДА ЫҒЫН F 
面 是 所 发 生 的 情 说 ， 

父 进 程 接收 并 捕捉 了 第 一 个 信号 。 妆 处 理 程序 还 存 处 理 第 一 个 信号 时 ， 第 二 个 信号 就 传送 并 添 
ШЕТ ЖИДЕ ЕШ. ЖАЛ. AX SIGCHLD 信号 被 SIGCHLD ЖЕНЕ ЗГ, 
信号 就 不 会 被 接收 。 此 后 不 入， 就 在 处 理 程 序 还 存 处 理 第 -个 入 号 时 ， 第 三 个 信号 到 达 了 。 二 为 已 
经 有 了 一 个 竺 处 理 的 SIGCHLD, = SIGCHLD AS 2d& ES. — А2, ARER], 
ABRERA AREN SIGCHLD fs5. MERZER TS. XR ERIS. UB 
二 恢 执 行 处 理 程 奈 。 存 处理 程序 完成 对 第 二 个 信号 的 处 理 之 后 ， 已 经 没有 待 处 理 的 SIGCHLD Atr 
T: 而 内 也 名 不 会 再 有 ， 因 为 第 三 个 SIGCHLD ЕЛ НЕГЕ АТ. НИЕ Ц, 
术 号 不 可 以 用 来 对 其 他 进程 中 发 生 的 事件 计数 ， 

为 了 收 下 这 个 问题 ， 我 们 必须 回想 一 下， 存在 一 个 待 处 理 的 信号 只 基 赔 示 自 进程 节 乒 一 底 收 到 
一 个 信和 咀 以 来 ， 至 少 已 经 有 一 -个 这 种 类 型 的 入 号 被 发 送 了 。 所 以 我 们 必须 修改 SIGCHLD 处 理 程序 ， 
使 每 次 SIGCHLD АНЕНЖНАЫ, ШЫЛ ЕТЕГІН. Е 829 Жл T É ЇЙ 


SIGCHLD 处 型 程序 。 
code/ecf/signal2.c 
1 $1nclude "csapp.h" 
2 
3 volc handier2[int siq) 
4 l 
5 pid t pid; 
5 
7 while i(pid = waitpid(-1, NULL, 0j) > 0) 
Я printfi"Handier reaped child $dXn", 'int)pid); 
9 1Ї [er)no !- ECHILD) 
10 unix error("waltpid error"!; 
1- Sleepí23); 
12 return; 
1% } 
14 
15 init mairi} 
15 1 
17 int i, n; 
18 char buf [MAXBUF': 
13 


20 if (signalíSIGCHLD, handler2) == SIG, ERR) 
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21 unix errorí"signal error"); 
22 
23 f* parent creates children */ 
24 tor {1 - O; i < 3; X++) Í 
25 if (Forki) == 0) ( 
26 printfí("Hello from child $din", (int)getpidi]ll; 
27 Sleepíll: 
28 exiti0]: 
29 ] 
29 } 
31 
32 /“ parent waits for terminal input and then processes it */ 
33 if (іп = read(STDIN FILENO, buf, sizeof(buf])) < Q) 
34 unix errorí"read error"); 
i5 
36 printfí("Parent processing lnputin"); 
47 while (1) 
38 : 
39 
40) exit(0); 
41 } 
code/ecf/siynal2.e 
B 8,29 signa? 


FH 8.28 M) МИЛ, EREREIERBME HS E тШ ЖНА RTEB FEE. FAI. CRA TERA AH ЗЕ I ur BENE. 
当 我 们 在 Linux 系统 上 运行 signal2 时 ， 它 可 以 王 确 地 回收 记 有 的 慑 死 子 进程 了 ， 


linux» ./signal2 

Hello from child 10378 
Hello from child 10379 
Hello from child 10380 
Handler reaped child 10379 
Handler reaped child 10378 
Handler reaped child 10380 
ccr» 

Parenb processing input 


ЖАП, DES ЕК3. ЕЭ] Solaris 系统 上 运行 signal2 ЖР, "EL AE ІН КТ 


НИЯ. FR n. ЖЕ, EREK read 系统 调用 在 我 们 在 键盘 上 进行 输入 之 前 ， 旬 前 返回 一 
пя: 


solaris» ,/signal2 

Hello trom child 18906 
Helio irom child 18907 
Hello from child 18908 
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Handler reaped child 18906 
Handler reaped child 18908 
Handler reaped child 18907 
read: Interrupted system call 


出 了 什么 问题 昵 ?出 现 这 个 问题 是 因为 在 这 个 Solaris ЖЖ E. WA read 这 样 的 慢 速 系统 调用 
在 被 信号 发 送 中 断后 ， 是 不 会 自动 重启 的 、 相反 地 ， 和 Linux 系统 自动 重启 被 中 断 的 系统 调用 不 同 ， 


它们 会 提前 返回 给 调 几 应 用 程序 一 个 错误 条 忻 。 


为 了 编 己 可 移植 的 信号 处 理 代码 , 我 们 必须 考 虚 系 统 调用 过 早 返 回 , 然后 于 动 重启 它们 的 情况 。 
4 8.30 展示 了 对 signall 的 收 改 ， 它 会 手动 地 重 语 被 终止 的 read УН]. ermo ДЕ) EINTR 返回 代码 


ДЕІН read 系统 调用 在 它 被 中 断后 提前 返 辣 了 ， 





1 tinclude "csapp.h" 

2 

3 void handler2(int sig) 

4 1 

5 pid t pid; 

b 

7 while (ipid = waitpid(-:, NULL, 0)) > 0) 
B printfíi"Handler reaped child #а\п", l(int)pid); 
9 if {errno (= ECHILD! 

10 unix error("'waitpid error"); 

11 с1еер (4); 

12 return; 

13 ) 

14 

15 int maini) Í 

16 int i, n; 

17 char buf[MAXBUF]; 

18 pid t pid; 

19 

20 1f [signal(SIGCELD, handler?) == SIG ERR) 
2l unix errori"signal error"); 

22 

23 ғ“ parent creates children */ 

24 tor (1 = Ü; 1 < 3; i++) f 

25 pid = Forkiíi»:; 

25 if (pid == 0) 1 

27 :  printfí("Hello from child £din"', 
AB Sleepíll: 

29 exit {0}; 

30 | 

31 ) 


code/ecf/signal3.c 


tint)getpid()l; 
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33 /* Manually restart the read call íf it is interrupted */ 

34 wille (ín = read(STDIN FILENO, buf, sizeof(buf))] < G) 
35 if (errno !- EINTR) 

i6 unix error,"read error"); 
37 
iB printfí"Parent processing inputin"!; 

39 while (1) 

40 ; 

41 

2 exit(0); 
43 1 

code/ecf/signal3.c 
ЕҢ 8.30 signal 
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当 我 们 在 一 台 Solaris 系统 上 运行 我 们 新 的 signal3 ЖЕРІ, F e ENEIT: 


solaris» ./signalJ 

Heilo from child 19571 
Hello from child 19572 
Hello from child 19573 
Handler reaped child 195/1 
Handler reaped child 19572 
Handler reaped child 19573 
CI 

Parent processing input 


8.5.5 ”可 移植 的 信号 处 理 

不 同系 统 之 间 ， 信 号 处 得 语义 的 差异 一 一 比如 一 个 中 断 慢 速 系 统 调 用 是 否 重 崩 或 者 永久 故 
Я-А Unix 信号 处 理 的 一 个 缺陷 。 为 了 处 理 这 个 问题 ，Posix 标准 定义 了 sigaction ЮЖ, € 
ЖҮК Posix 兼容 系统 的 用 户 ， 比 如 Linux 和 Solaris ІЛІП, Riese d ACE LS АЕ 
X. 


| ce z«signal.h- 


int sigacrion[int signum, struct sigaction *act, struct sigacticn *oldact); 
返回 ; 359032025 0, X E E - 

sigaction P Zia HEAT. EE ER EB OTT ESTE Cent). o REB ER] X. 
最 初 是 Stevens 提出 的 [81], 就 是 定义 一 个 包装 (wrapper) 函数 , ЖЕЛ Signal. 它 为 我 们 调用 sigaction. 
图 8.31 给 出 了 Signal 的 定义 ， 它 的 调用 方式 与 signal 函数 的 调用 方式 - Ж. Signal ША ИЕ Т 
一 个 慎 号 处 型 程序 ， 其 依 号 处 型 语义 如 下 : 

° 只 有 这 个 处 理 程 序 当 前 正在 处 理 的 那 种 类 型 的 信号 被 阻塞 。 

* 和 所 有 信号 实现 一 样 ， 信 和 号 不 会 排队 等 待 。 
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只 要 可 能 ， 被 中 断 的 系统 调用 会 自动 重启 。 

上 且 设 置 了 依 导 处 理 程 序 , 它 就 会 一 直 保 持 , 直到 Signal 8/Ж handler 参数 为 SIG_IGN 或 者 
SIG_DFL 被 调用 。( 一 些 比较 老 的 Unix 系统 会 在 一 个 处 理 程 序 处 理 完 一 个 倩 号 之 后 ， 将 信 
号 行为 恢复 为 它 的 默认 行为 ,) 


code/sre/csapp.c 


handler t *Signalí(int signum, handler t *Landler; 


і 


struct sigaction action, old action; 


acticn.saà handler = handler: 
sligemptyset:&action.sa, mask); /* block sigs of type being handled */ 
action.sa Flags = SA RESTART,; /* restart syscalls if possible */ 


іс (sigactionísignam, &action, &old action] < 0) 
unix, errori"Signal error"): 
return (014 action.sa handler); 


cade/src/ecsapp.c 


图 8.31 Signal 


sigaction 的 -个 包装 通 数 ， 它 提供 Posix AE RATEN ЕЛКЕ. 


图 8,32 展示 了 图 8.29 中 signal? 程序 的 一 个 版 本 ， 该 版 本 使 用 我 们 的 Signal 包装 函数 在 不 同 的 计算 
机 系统 土 获得 机 预测 的 信和 号 炉 理 语义 。 惟 一 的 区 别 是 我 们 是 通过 调用 Signal 而 不 是 调用 signal 来 设置 处 
ЕРЙ БИЕ, AFRL Solans 也 可 以 在 Linux 系统 上 正确 运行 了 ， 和 南 我 们 电 椒 府 需 归 手动 地 重 
НЕШЕ read 系统 调用 了 ， 





со =] ст л ш D к= 


code/ecfrsienald.c 


tinclude "csapp.h" 


void handler2(int sid! 


l 
pid t pid; 
wnile {ipid = waitpidi-1, NULL, 0)) > 0) 
printfi"Handler reaped child $&dWn", (intlpid); 
if (errno !- ECHILD) 
іпіх error("waitpid error"); 
Sleepl2); 
return; 
j 
int mainí) 
{ 
int i, n: 


char buf[MAXBUF]; 
pid t pid: 
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20 

21 Signal(SIGCHLD, handler2); /slpaction error-handling wrapper */ 
22 

23 /* parent creates children */ 

24 for (i = 0; i < 3; i++) Í 

25 pid = Fork(): 

26 if ipid == 0) í 

27 printfi"Hello from child #d\n", iinti)getpid[))]; 
28 Sleepil); 

29 exit(0); 

30 j 

31 } 

32 

33 /* parent waits for terminal input and then processes it */ 

34 if {in = read(5TDIN,FILENO, buf, sizeof(buf),) < D) 
35 unix errori("read error"); 

36 

37 printf("Parent processing inputin"); 

38 while 41) 

39 ; 

49 Exit (Ü); 

Al ) 


code/ecf/signald.c 


图 8.32 signaM 
图 8.29 的 一 个 版 本 ， 访 版 本 通过 使 用 我 们 的 Signal 包装 函数 得 到 可 移植 的 信号 处 理 诸 立 ， 


8.5.6” 显 式 地 阻塞 信号 
БУ ТЕГЕП R] sigpromask 函数 显 式 地 阻塞 和 取消 阳 塞 选 样 的 信号 ; 


#include «signal, h» 


int s`gprocmaskiint how, const sigset t *set, sigset.t *oldseL;; 
int sigemptysetisigset t *set); 

int sigfillsset(sigset t *set); 

int sigaddse-(sigset t *set, int signum); 

inz sigdelsetisigset t *set, int signum); 


Ж; deu x03 0. Æ EAR- 


int sigismemberí(const sigset L *set, int signum); 


ik): Ж signum X sef 的 成 员 则 为 1， 若 出 错 则 为 人。 
sigpromask 图 数 改变 当前 已 阳 塞 信号 的 集合 (blocked 位 向 量 在 8.5.1 节 中 描述 )。 上 只 体 的 行为 依 


-F how В: 
* SIG BLOCK: WRA set 中 的 信号 到 blocked T (blocked-blockedlset?. 


+ SIG_UNBLOCK: 从 blocked 中 删除 set 中 的 入 和 号 (blocked=hblocked& set), 
. SIG_SETMASK: blocked=set. 


ЖЖ oldset ЗЕЗ?, blocked 位 问 量 以 前 的 值 会 保存 在 oldset 中 。 


544 第 8 章 


可 以 使 用 下 列 函 数 扎 作 像 set 这 祥 的 信和 号 集合 。sigemptyset 初始 化 set ЗЕ. sigfillset 函数 将 
SET a 5 ЕЛ! set 中 。sigaddset РЁ ЖЕЛ signum 到 set, sigdelset 从 set ТІҢ signum. WE signum 
E set Ил, WA sigismember 返回 1, Ez ^ MNE [B] 0. 

sigprocmask 也 数 对 于 同步 父子 进程 是 很 方便 的 。 比 如 , 考虑 图 8.33. 它 总 结 了 一 个 典型 的 Unix 
shell 的 结构 。 父 进程 在 一 个 作业 列表 中 记录 着 它 的 子 进 程 。 当 父 进程 创建 一 个 产 的 于 进程 时 ， 它 央 
扫 记 个 子 进程 烧 加 虽 作 业 列 表 中 。 当 父 进程 在 SIGCHLD AEFT [а ЕН) CRO ТЖ 
程 时 ， 它 不 从 作业 列表 中 删除 这 个 子 进程 。 


code/ecf/procmask.c 


1 void handleríint sig) 

2 { 

3 pid t pid; 

Д while (ipid = waitpid(-1, NULL, 0р) > 0) /*Reapa zombie child */ 
5 deletejob(pid); /* Delete the child from the job list */ 

б if (errnc !- ECHILD) 

7 unix errarí("'waitpid error"); 

8 | 

9 

10 int maiciint агас, char **argv) 

11.4 

12 int pid; 

13 slgset t mask; 

14 

15 SlgnaliSIGCHLD, handler); 

16 initjoEs(); /*Initialize the job list */ 

17 

18 whiie (1) { 

19 Slgemptysetí&mask); 

20 Sigqaddset (smask, SIGCHLD}: 

21 Sigprocmask(S:G BLOCK,&mask, NULL]; /* Block SIGCHLD */ 
22 

23 ж Child process */ 

24 if {ipid = Fork()) == 0] Í 

25 Sigprocmask(SIG ULNBLOCEK,&mask, NULL); /* Unblock SIGCHLD */ 
26 Execve("/bin/ls", argv, NULL); 

2 ) 

28 

29 /* Parent process */ 

30 addjobipid); /* Add the child to the job list */ 

3l Silgprccmask(SIG UNBLOCE,&mask, NULL); /* Unblock SIGCHLD */ 
32 ) 

33 ехісі0); 

34 ) 





code/ecf/procmask.c 
ІҢ 8.33 FB sigprocmask 来 同步 进程 
ios. RTA) deletejob 之 前 保证 执行 了 addjob. 
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WERTERA E e Y ER, ABA REB E МІНЕР: 
. SHEMI Fork eR fr, ЗЕНИТА ТОА ЕҚ XERUR 1T. 
. Ж AHD PLE RETZ. TARAI FERAE., EE A E A 
SIGCHLD ЕЕ. 
. БЖ, ЛЕШЕ КАВ АА ТАА МЕРА е АТ, РЕННЯ) SIGCHLD fi >, 
Н ЗАТТЕК {д =. 
в 处 理 程序 回收 终 目 的 了 进程 ， 并 调用 deletejob. АЗГА ЫЧ, АХ YR ER TE 
IK FERAS SIT RR. 
. 在 处 理 程序 运行 完毕 后 ， 内 核 运行 父 进 程 ， 父 进程 从 fork ini, ЖИН] addjob 错误 地 把 
(不 存在 的 )》 子 进 程 添 加 到 作业 列表 中 ， 
关键 问题 是 如 果 我 们 什么 都 不 做 ， 那么 就 可 能 在 执行 addjob ZB], 执行 deletejob。 图 8.33 展示 
了 改 下 这 个 问题 的 一 种 方法 。 遂 过 在 调用 fork 之 前 , 阻塞 SIGCHLD 信号, 然后 在 我 们 调用 f addjob 
Д НУН ВВ ЗАН ә, But ТЕ ГЕНЕ ТЕУІ р а, ux. 
НЕТЕВЕЯЖТ ЕПХЕНІНЖЕН Ө. АЗЫП ШЕШ execve УОН, МОНИ Е F 
ЖЖЖ SIGCHLD 信号。 


8.6 dEAIBBE 


C 提供 了 一 种 形式 的 用 广 级 异常 控制 流 ， 称 为 非 本 地 跳 转 《nonlocal jump) OEC E Fe À -- 
个 泊 数 转移 天 为 一 个 当 病 正在 执行 的 消 数 ， 而 不 需要 绑 过 正常 的 调用 -返回 序列 。 非 本 地 涉 转 是 通 
过 setjmp 和 longimp 函数 来 提供 的 ， 


#lncluade «setjmp.h» 


int seujmpijmp_buf env); 
int sigset mpísiggjmp buf env, int savesiqs); 
18 15]; setimp 2818 0. longimp i& t 4E XE, 


setjmp MATE елу 缓 神 区 中 保存 当前 栈 的 内 容 ， 以 供 后 面 longjmp 使 用 ， 并 返 可 O. 


#Binclude <setjmp.h> 





void longjmpijmp_buf env, int retval); 
void siglongjmp(sigjmp buf env, int retval}; 





MUR 8. 
longjmp А env 缓冲 区 中 恢复 栈 的 内 容 ， 然 后 触发 -个 从 最 近 一 次 初始 化 епу 的 setjmp 调 
НЭ ЛБ [А]. ЖЕ setjmp HE ARA ЧЕЗ ЈК [РА retval, 
ARETE., setjmp 和 longjmp Z ВАНН X 52 АЖ. setjmp 函 教 只 被 调用 一 次 ， 但 返 
回 多 次 一 一 - 次 是 当 第 一 次 调用 setjmp， 而 乒 的 上 下 文保 存在 缓冲 区 env 中 时 :一 次 是 为 每 个 相 永 
的 ]ongjimp。 另 -方面 ，longjmp 函数 只 被 调用 一 次 ， 但 从 不 返回 。 
非 杯 地 跳 转 的 一 个 重要 应 用 就 是 允许 从 - -个 深层 嵌 仍 的 函数 调用 中 立即 返回 ， 通 常 是 由 检测 到 
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AP Ta НЫП]. MRE- TURIS ВЕ hi PR ЖЕЛ Т ЯТ РНН, ЖАПАЙ УЕА 
ДИНЕН FL Tea [n|#)— МЕМ ЖММ Е ЛЕ, ПОЛА J UE ТИН. 

图 8.34 展示 了 一 个 示例 ， 说 时 这 可 能 基 如 和 何 上 作 的 ，main 函数 首先 调用 setjmp 以 保存 当前 栈 
L Кж. АЕН Ж foo. Foo НІВЕ РЕЖ bar。 如 果 Foo 或 者 bar Aaj- 个 错误 ,它们 立即 通过 
一 次 longimp 调用 从 setjmp ЖІБІ. semp 的 非 宪 返 回 值 指 时 了 钳 误 美 型 ， 随 后 可 以 被 解码 ， 及 在 代 


hd rp m AE o Pai IER 
code/ecf/setimp.c 
1 #include "csapp.h" 
2 
3 јпр buf but; 
4 
5 int errorl = 0; 
Ë ігі error2 = 1; 


B void fooivoid], bar(void); 

9 

10 int mainí) 

1l | 

1? int ro; 

13 

14 rc = setjmp[but); 

15 if (rc == 0) 

16 fool); 

17 сіне if irc == 1) 

18 printrfi"'Detected an error] condition іп foon"); 
19 else 1f irc == 2) 

20 printfi"Detecied an error? condit. on in foo'n"); 
2 | else 

22 printf "Опкпом error condition in foosn"): 

23 exitii: 

24 ) 

45 


26 /+ deeply nested function foo */ 
27 void 200%У014) 


à 1 

29 „Т ierrorl] 

20 longjmpibuF, 1); 
31 barí); 

32 J 

33 

34 vold Багіуо1а) 

35 { 


ib if [errorz! 
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17 longjmpibuf, 2}; 


code/ecf/setimp.c 


8.34 ЧЕЖЕ) 
Ж Г ШАЕ ЖАЙ ЖА СЕНО ОЯТА Е. ПТ ЖЖ АВ КЕННЕ, 


3E b ps B5 5) — 7 3E EYE i RE IE I bs REESE КА — SPERM E. m ROTG 
到 被 信和 号 到 达 中 断 ЗЕН. А 6.25 Е Г ТЕН. WS ТХЕ kia A. CARD 
ЕН LEA ctl-e 时 ， 这 个 程序 用 信和 号 和 非 本 地 跳 转 来 实现 软 重 启 。sigsetjimp 和 siglongjmp 函数 
是 setjmp 和 1longjmp 的 可 以 被 信号 处 理 程序 使 用 的 版 本 ， 


code/ecffrestart.c 
1 Kincluce "csapp.h" 
2 
3 5igunp buf but; 
4 
5 void handler!int sig! 
6 { 
É siglongjmpibuf, 1); 
8 | 
9 
10 int maini) 
1. f 
12 SignaliSIGINT, handler); 
13 
l4 if [('aslgsetjmpiíbuf, 1)) 
15 printfí("startingin"); 
16 else 
17 printfí"restarting'in"); 
18 
19 whileí1) 1 
AU Sleepill; 
21 printfi"'processing... Ann); 
22 } 
23 exit(ü): 
24 | 

code/ecférestart.c 


45.5 SHARA ctri-c 时， 一 个 使 用 非 本 地 跳 转 来 重启 动 它 本 身 的 程序 


在 程序 第 一 次 启动 时 ， 对 sigsetimp 范 数 的 初始 调用 保存 了 栈 和 信号 的 上 下 文 。 随 后 ， 主 函数 进 
入 一 个 无 眼 处 理 循环 。 当 用 户 键入 cul-c WF, shell 发 送 一 个 SIGINT 傅 号 给 这 个 进程 ， 该 进程 捕获 
这 个 伟 号 。 不 是 从 信号 处 理 程序 返回 ， 此 时 信号 处 理 程序 会 将 控制 返回 给 被 中 断 的 处 理 循环 ， 取 而 
代 之 的 是 ,处理 程序 执行 - -个 非 本 地 跷 转 ， 回 到 main 函数 的 开始 处 。 当 我 们 在 系统 上 运行 这 个 程序 
时 ， 我 们 得 到 以 下 输出 : 


248 第 8 章 


unix» ./restart 
starting 
processing... 


processing... 
restarting user hits ctrl-c 
process.ng... 
restarting User hits ctrl-c 


process ng... 


Sui. C++ 和 Java 中 的 软件 异常 

C++ 和 Java 提供 的 异常 机 制 是 较 南 层次 的 ,是 忆 的 setmp f$: longjmp iid 85 3 dud ЖИЫН... 
你 可 以 把 try 请 可 中 的 catch FIARE setjmp dd X 4235. 38/4035, throw 356] 8E XT longjmp 
Ж. 


87 ”操作 进程 的 工具 


Unix 系统 提供 了 估量 的 监控 和 操作 进程 的 有 用 工具 ， 

strace: 打印 一 个 程序 和 它 的 了 进程 调用 的 每 个 系统 调用 的 轨迹 。 对 于 好 奇 的 学 生 而 吉 , 这 是 一 
个 令 人 者 迷 的 di. M-statie 编译 你 的 程序 ， 能 得 到 一 个 更 清楚 的 轨迹 ， 而 不 带 有 人 量 与 共享 库 相 
天 的 输出 ， 

ps: ДІН АЮП САИН СӘМЕН). 

top: 打印 出 区 寺 当前 进 竹 资 源 使 用 的 信息 。 

kill: A “个 信号 给 进程 。 对 二 调试 带 情 号 处 理 程序 的 程序 以 及 清除 牙 以 瑟 麻 的 进程 是 非常 有 
用 的 ， 

{ргос (Linux ЖІ Solaris): ЕЗУ, L ASCH 文本 格式 输出 人 晶 内 核 数据 结构 的 内 
T MP FRF MURRER., An, 80А, “cat /fproc/loadavg”， 规 察 在 你 的 Linux 系统 上 当前 的 
IAE. 
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开 常 控制 流 发 生 在 计算 机 系统 的 各 个 层次 。 在 硬件 层 ， 异 常 是 由 处 理 器 中 的 事件 触发 的 控制 流 
中 的 括 变 。 控 制 流传 递 给 一 个 软件 处 媒 程序 ， 恋 处 理 程 序 进行 一 些 处 理 ， 然 后 返回 控制 给 被 中 断 的 
控制 流 。 

有 四 种 不 同类 型 的 异常 ， 中 断 、 上 故障、 终止 和 陷 缠 。 当 一 个 外 部 的 UO BER. ӨШЕНШЕҢ 
或 者 一 个 磁盘 控制 器 ， 设 置 了 处 理 器 蕊 片上 的 中 断 管 脚 时 ，( 对 于 任意 指令 ) 中 断 会 异步 地 发 生 。 控 
制 返回 到 中 断 指令 “的 下 一 条 指令 。 执 行 一 条 指令 可 能 导 答 故障 和 终止 的 发 生 。 故 障 处 理 程 译 会 重 
新 开始 故障 指令 ， 而 终止 处 理 程序 从 不 将 控制 返回 给 被 中 断 移 流 。 最 后 ， 陷 阱 就 像 是 用 来 实现 系统 
ЖНА ШИШ. АНЕ ЕЕ ЛУН ЖП ЕЖЕН ЕЕ А ПЕ. 


2 RLAR. —WS 
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在 操作 系统 层 ， 内 核 提供 基于 一 个 进程 的 基础 性 概念 。 一 个 进程 提供 给 应 用 两 个 重要 的 抽象 ， 
逻辑 控制 流 ， 它 提供 给 每 个 程序 -个 假象 ， 好 像 它 是 在 独占 地 使 用 处 理 器 ， 怨 私有 地 址 空间 ， 它 
提供 给 每 个 程序 一 个 假象 ， 好 像 它 是 在 独占 地 使 用 主 存 。 

在 操作 系统 和 应 用 之 间 的 接口 处 ， 应 用 可 以 创建 子 进程 ， 等 行 它们 的 子 进 程 暂 爷 成 者 终止 ， 运 
行 新 的 程序 ， 并 捕 提 来 日 其 他 进程 的 信号。 信号 处 理 的 语义 是 微妙 的 ， 并 是 随 系统 不 同 而 不 同 。 然 
而 ， 在 与 Posix 兼容 的 系统 上 存在 着 一 些 机 制 ， 人 允许 程序 清楚 地 指定 期 望 的 入 号 处 理 语义 ， 

жп, GERE, C 程序 可 以 使 用 非 本 地 跳 灶 来 规避 正常 的 调用 /返回 栈 规则 ， 并 且 直 接 从 一 个 
ЖЖ ЕЮ] TAR. 


参考 文献 说 明 

Intel $R E 8 28 ЛЫ ЖШ B) Sr А] Intel 处 理 器 上 -的 异常 和 中 断 网 详细 讨论 [19]。 操作 系统 教科 书 [70， 
75, ВЗ] ЧЕ T RE. EROR s N ИНАН (БА. Stevens ЈЕ 8. 776]. BRE АХАТ, ÆN 
ЖА SAPERNE ERAN, E XF an fn ЕЛУ НЕН ВАН ЗЕ МИЕ S RU. 


家 庭 作 业 

88 € 

EA - 章 里 ， 我 们 介绍 了 一 些 有 不 寻常 的 调用 和 返回 行为 的 函数 ， setjmp. Іопрјтр. execve 和 
fork。 找 到 下 列 行为 中 和 每 个 函数 相 匹配 的 一 神 ， 

А. WHR BERR. 

B. ЯШ, MAEN. 

C. 调用 一 次 ， 返 加 一 次 惑 者 党 次 。 


8,9 € 
下面 程 序 的 可 能 的 输出 是 什么 ? 
сойе/есДотЕркоВЗ,с 
1 #1пс1мде "сварр.Н” 
2 
3 int maini) 
4 [ 
5 int x = 3; 
5 
7 if ;Forkí() != 0) 
В printfí"x-*din", ++х}; 
9 
10 printfí"'"x-&d'in", --x); 
1] exitt0]; 
12 } 
code/ecffforkprob3.c 
8310 € 


站 面 这 个 程序 会 输出 凶 少 个 “hello” 输 出 行 ? 


350 


1 include "csapp.h" 
2 
3 void doit ií) 
4 I 
5 if (Forzí() == O) { 
5 Богк(); 
7 printf("helloin";; 
a ехікіШі; 
9 | 
10 return; 
ll 1 
12 
13 int maini} 
l4 | 
15 doit(); 
15 printfi"he loin"); 
17 exití(ü]l; 
18 } 
8.11 Ф 


55% 


下 面 这 个 程序 会 输出 多 少 信 “helio ”输出 行 ? 





мо 00 — £n (Doa t0 м ҥ— 


= aL p 
ue ol p c 


к< ке ке 
іл B 


F3 -- 
Qo ~] 


*-nclude "csapp.h" 


void doit!) 


printfi"helloin"); 


retJrn; 
} 


return; 


int maini) 

I 
doit); 
printfí("helloMn"); 
exitio: 

| 


сейе/ес[огЕргоб5, с 


code/echrorkprob5.c 


code/ecfífforkprob6.c 


— OO OM r O  v-Tnçph4eecffforkprob6, с 


812 % 
下 面 这 个 程序 的 输出 是 什么 ? 
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code/ecf/forkprob. c 


l tinclude "csapp.h" 
2 int counter = 1; 
i 
à int main(í) 
5 | 
É if (fork() == 0) 1 
? counter--; 
8 èxit (0); 
9 ] 
1C else { 
11 Wait {NULL}; 
12 printfí"counter = %jxXn'", ++counter],; 
13 } 
14 exit (ÜC); 
15 ] 
code/echforkprob?.c 
B13 € 
列举 练习 题 8.4 中 程序 所 有 可 能 的 输出 ， 
8,4 %% 
考虑 下 面 的 程序 ， 
code/ecf/farkprab2.c 
] *include "csapp.h" 
2 
5 void endívoid) 
4 1 
5 orintfí"2"); 
б } 
+ 
H int mairi) 
9 I 
10 if ТБогк() == 0) 
11 atexití(end): 
12 if Forki} == 07 
13 printti"0'); 
14 alse 
15 printfí("l1"); 
16 exit(0); 
17 1 





code/ecfiforkprob2.c 
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判断 直面 哪个 输出 是 可 能 的 。 注 意 ，atexit BW УЕ [s] Pq Se ЕН 3 А. EERME E 
数列 表 中 【初始 为 空 )， 当 exit 函数 被 调 有 几时， 会 调 州 该 刻 表 中 的 国 数 。 
A. 112002 
B. 211020 
‚ 102120 
, 1220001 
E. 100212 


815 %% 

ЕНІ execve 编写 一 个 叫做 myis 的 程序 ， 访 程序 的 行为 和 /bimls 程序 的 - - 样 。 和 你 的 程序 应 该 接 
变相 同 的 全 令 行 参 数 ， 解 释 同 梓 的 环境 变量 ， 并 产生 相 问 的 输出 。 

ls FF £M, COLUMNS 环境 变量 中 获悉 屏幕 的 宽度 的 。 如 果 没 有 设置 COLUMNS. ЖА 18 会 
假设 屏幕 宽 ВО 列 。 因 此 ， 你 可 以 通过 把 COLUMNS 环境 设 兽 得 小 于 80， 来 检查 你 对 环境 变量 的 处 
E. 

unix» setenv COLUMNS 40 

unix» ./myis _ 

. output is 40 columns wide 
unix» unsetenv COLUMNS 
unix» ./mylis 
, омо is now BÜ columns wide 

8.16 %Ф%% 

Ж ИЧ 8.15 P FELT. Ый МЕН ATE: 

|l. 每 个 子 进 程 在 试图 写 个 只 读 文 本 段 中 的 位 置 时 会 异常 终止 

2， 父 进程 打印 和 下 面 所 未 相同 《除了 PID) 的 输出 ， 

child 12255 terminated by signal ll: Segmentation fault 

child 12254 terminated by signal 11; Segmentation fault 

jen: WSE Walt(2) 和 psignal(3)0] man H. 

817 %%% 

ЛАН Ж Unix system ЖЖ: 

int mysystem(char *command!; 

mysystem Р #081119 9 “bin/sh — command" 来 执行 command, 然后 在 command 完成 后 返回 ， 
XL command 正常 退出 (通过 调用 exit 两 数 或 者 执行 一 个 return ЕЕ), Ж-А. mysystem 返回 command 
的 退出 状态 。 比 师 , 如 条 command 通过 调用 елі) 1, 那么 mysystem 返 同 信 8 否则 ;如 果 command 
ЖІ, ЯА mysystem 返回 由 shell 返回 的 状态 。 

918 € 

你 的 一 位 同事 正在 考虑 使 用 信人 号 来 允许 一 个 父 进程 计 算 了 进程 中 发 生 的 车 件数， 基本 思路 是 每 
次 一 个 事件 发 生 时 ， 通 过 发 送 个 信号 来 通知 父 进程 ， 并 且 让 父 进 种 的 信号 处 理 程序 增 如 全 局 变量 


с r 
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counter, ЖЕНЕ n] DATE НАНЫ ҚАР, ТИП. ЖА КЕЛТІ 8.36 中 的 测试 程序 
了 时， 他 发 现 当 父 进程 调用 printf BJ, counter 总 是 保持 一 个 值 2， 即 使 是 子 进程 已 经 发 送 了 5 个 信号 
给 父 进 程 ， 带 着 图 惑 ， 他 来 辐 你 求助 。 你 能 解 靶 一 下 这 个 程序 有 什么 错误 吗 ? 
OO codefecf/counterprob.c 
Kinclude "csapp.h" 


int counter = Q; 


1 

2 

3 

4 

5 void handler(int sig! 
© [ 

7 

8 

9 





COunrter++; 

slee (1); /*dosome work in the handler */ 

return; 
10 ! 
11 
12 int mayni) 
13 [ 
14 int 1; 
15 
16 Signa.(SIGUSR2, handler); 
18 if (Fork() == 0] 4 #* child */ 
19 for [1 =й; і < 5; 1++) Í 
90 Killí(getppidí), 5150582); 
21 printfti"sent SIGUSRZ to рагепЕ\п")}; 
22 | 
22 exitíü): 
24 ) 
25, 
26 Walt (NULL) ; 
27 prinrt("counter=s%dxXn", counter); 
28 exitio); 
29 |) 

code/ecf/counterprab.c 
Кі 8.35 图 8.18 中 引用 的 技术 程序 
819 ФФ9% 


编号 tgets 了 消 数 的 一 个 版 本 ， 叫 做 tfgets， 它 5 秒 钟 后 会 超时 。ttgets 函数 接收 和 fgets 相同 的 输 
Жа WRH E SERATA- ШАЯ, tfgets EE NULL., 否则 , 它 返 回 一 个 指向 输入 行 的 指针 。 
820 %Ф%%% 


以 图 8.20 中 的 示例 作为 开始 点 ， 编 写 一 个 支持 作业 控制 的 shell 程序 。 你 的 shell 必须 具有 以 下 


554 


ЕЖ 





А ЕВ 1T Н — nme, 1004601 ИН. Pr 08 E РМ £ ЕН 
ЛЯ. ШЕ name 是 一 个 内 置 命令 ， 那 么 shel 就 立即 处 理 它 ， 并 等 待 下 一 个 命令 行 ， 

271], shel ЛЕС name 是 “个 可 执行 的 文件 ， 在 一 个 初始 的 子 进程 【作业 》 的 上 下 文中 加 
载 并 走行 它 。 作 业 的 进程 组 ID 与 了 进程 的 PID 相同 

每 个 作业 是 由 一 个 进 穆 ID OPIDO. 或 者 一 个 作业 ID OIDO 来 标识 的 ， 空 是 习 一 个 shell 分 
配 的 小 的 任意 眶 整数 。JID p pir НІНІ "96" RER. БП, "965" de JID 5, ІП ^5" 
жук РТ 5. 

an ог AT ELSOK ЯЕ, MA shell 就 在 后 台 运 行 这 个 作业 ， 否 则 ，shell 在 前 台 这 行 这 个 作 
Мр, 

输入 ctrl-c Ссіг-2), 119 shell 发 送 一 个 SIGINT (SIGTSTP) {@ ЕНА S SEA JE 
Ж. 

AES Jobs 列 出 所 有 的 后 台 作 业 。 

内 置 命令 bg <job> 通 过 发 送 一 个 SIGCONT 信号 重启 <job>， 然 后 在 乒 台 运行 它 。<job> 参 数 
可 以 是 一 个 PID， 世 可 以 是 一 个 HD. 

内 置 命令 fg <job> 通 过 发 送 一 个 SIGCONT 信号 重启 <job>， 然 后 在 前 台 运 行 它 ， 

shell 回收 它 所 有 的 但 死 子 进 称 。 如 果 任 何 作业 因为 它 收 到 Akins m ЛА 
shell ІҢ “条 依 鼠 到 和 终端， 包含 该 作业 的 PID 和 对 违规 入 号 的 描述 。 


{837 展 东 了 了 一 个 示例 的 shell Zu. 


unix» shell Run your shell program 
» bogus 


bogus: Command not found. Ехесуе can't find executable User гурех ctrl-c 
> foo 10 

job 5035 Lerminated Бу signal: Interrupt 
> foo 100 & 

[1] 5036 foo 100 & 

> foo 200 & 

[2] 5037 foo 200 & 

> Jobs 

|1] 5036 Running too 100 & 

[2] 5037 Running foo 200 k 

> fg el 

“ob [1] 5036 stopped by signal: Stopped User types ctrl-z 
» Jobs 

|1) 5036 SLopped foo 100 & 

[2] 5037 Running foo 200 & 

> bg5035 

2035: No such process 

> bg 3036 

[1] 5036 foo 100 & 

> нык! 5036 

Job 5036 terminated by sianal: Terminated 


BO 555 


> fg %2 Waitfor fg Job to finish. 
quit 
unix Back to the Unix shell 


8.37 习题 8.20 的 shell 交互 示例 
ЖЕ 2] Ай X 


练习 题 8.1 答案 

在 我 们 图 8.13 中 的 示例 程序 中 ， 父 于 进程 执行 无 关 的 指令 集合 。 然 而 ， 在 这 个 程序 中 ， 父 子 进 
程 执行 的 指令 集合 是 相 基 的 ， 这 是 有 可 能 的 ， 因 为 父子 进程 有 相同 的 我 码 段 。 这 会 是 一 个 概念 上 的 
障 得 ， 针 以 请 确认 你 理解 了 本 题 的 答案 ， 

А. ТИН ЕГА? 这 时 的 关键 点 是 子 进程 执行 了 两 个 printf 语句 。 在 fork 返回 之 后 ， 
它 执行 了 第 8 行 的 printf。 然后 它 从 证 语句 中 出 来 ,执行 了 第 9 行 的 primtf 语句 。 下 面 是 子 进程 产生 
ИЧ: 

printfl: x-2 

printf2: x-1 

B. НИН ЫТ AE? МУШЕ r [ 2 9 irt) print: 


printf2: х=й 


练习 题 8.2 答案 
这 个 程序 和 图 8.14 Сс) 中 的 程序 有 相同 的 进程 图 。 一 共有 四 个 进程 ,每 个 打印 一 个 “helo” 47. 
因此 ， 程 序 打 印 四 个 “hello” 行 。 


练习 题 8.3 答案 

这 个 程序 和 图 8.14 (с) 有 相同 的 进程 图 。 一 共有 四 个 进程 ， 每 个 输出 一 个 单独 的 “hello” 行 在 
doit (h, 并且 在 它 从 dot 返回 后 也 在 main 中 输出 一 个 "hello” 行 ,因此 ,这 个 程序 就 - -共有 八 个 “hello” 
行 输出 。 

练习 题 8.4 答案 

A. 每 次 我 们 运行 这 个 程序 ， 就 会 产生 六 个 输出 行 。 

B. 和 输出 行 的 鹏 序 根据 系统 不 间 而 不 同 ， 取 决 于 内 核 如 何 变 替 执行 父子 进程 的 指令 一 般 而 音 ， 
下 图 内 任意 拓扑 排序 都 是 有 效 的 晒 序 ， 


一 一 学 E LA -5 B E -- ` ' Bye ' ' ене 


--> 1 4144 --> " ' Bye! ! FHR 


БП, “ӘИЕЛ МЕНЕН, 24830 F, 


unix» ./waitprobl 
Hello 


556 #, 3 а 


Bye 

ХИА, МИН АПЕТ, E 8 ITHE "Hello", f 10 4741 81 “0°. Ж wait 的 调用 
ЖНЖ, А-АА ЗЕ, ВТЕ ar F L КҰН», ЛЕРМЕН ГЕШ. DER 
在 第 10 行 打印 “1”, 在 第 16 行 打印 “Bye”， 然 后 在 第 17 行 终止 ， 退 出 状态 为 2。 人 在 了 进程 终止 
后 ， 父 进程 继续 ， 在 第 14 行 打印 子 进程 的 退出 状态 ， 在 第 16 行 打印 “Bye”。 


练习 题 8.5 EXE 


code/ecf/snooze.c 
1 unsigned int snooze(unsigned int secs) 1 
2 unsigned int rc = sleep(í(secse); 
3 printf("Slept for $u of Фи веся. \п", secs - rc, secs); 
4 return rcg; 
ш, 


code/ecf/snooze.c 





练习 题 8.6 ЖЖ 
code/ecf/myecho.c 
] &Kinclude "csapp.h" 
2 
3 int mairí(int ағас, char *argv[], char *envp[]) 
3 | 
қ int 1; 
б 
7 orintfi"Command line arguments:*n"]; 
B for 11=0; argv[i] != NULL; i++i 
g printf" argv[*2d]: $s*n", 1, àrgv[1]); 
10 
11 printti" n"); 
12 printi" Environment variables:in"): 
13 for і1-П; envp[i] != NULL; i++} 
14 printi" епурі%2д4|: %а\п", i, envp[il); 
15 
16 exitio); 
17 } 
code/ecf/myecho.c 
练习 题 8.7 答案 


ЖАКЕ) ARRERA S. sheep 函数 就 会 提前 返回 , 但是， 因 为 收 到 :个 SIGINT 
舍 号 的 默认 行为 就 是 终止 进程 《图 8.23)， 我 们 必须 设置 一 个 SIGINT 处 理 程 序 来 允许 sleep 函数 返 
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ІН. kbl 08] E НЫ SIGNAL, Ў ЗФА 88 sleep 国 数 ， 该 函数 会 立即 返回 。 


code/ecf'snooze.c 


1 +#include "сварр.п" 

2 

3 /* SIGINT handler */ 

4 void handler (int 514) 

5 | 

É return; /* catch the signal and return */ 

7 ) 

B 

9 unsigned irt snooze(unsigneá int secs) Í 

10 unsigned int rc = sleepísecs): 

11 printti" Slept for $u of tu secs.in", secs - rc, весь}; 
12 return rc: 

13 |} 

14 

15 int mainiint argc, char **ardv) Í 

15 

17 it (arog l= 2! [ 

18 fprintfístderr, "usage: *s «secs»in^", argv[01]); 
13 exit (0) ; 

20 | 

Al 

22 if isigral(SIGINT, handler) == SIG ERR) /* install SIGINT handler */ 
23 "nix errorí"signal errorxn"): 

24 (void])snoozetatoil(argv(ll)); 

25 exit {0}; 

26 o) 





code/ecf/snooze.c 
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СНАРТЕВ 


测量 程序 执行 时 间 


9.] 
9.2 
9.3 
9.4 
9.5 
9,6 
9.7 
9,8 
9.9 
9.10 


计算 机 系统 上 的 时 间 流 

通过 间 障 计数 [interval counting) SX ЕУ [8] 
周期 计数 器 

用 周期 计数 器 来 测量 程序 执行 时 间 

基于 gettimeofday HAHAE 

综合 : 一 个 实验 协议 

展望 未 来 

现实 生活 :人 次 最 优 测量 方法 

得 到 的 经 验 教 训 

小 结 


561 
565 
568 
570 
583 
586 
586 
586 
587 
587 


560 # 9 * 


人 和 们 经 常 问 的 一 个 问题 是 :“ 程 序 X 在 机 器 Y КЕТЕ f£?" -MARBMOUURIYTYEREM B 
序 员 ， 或 着 一 个 想 竖 决定 买 哪 台 机 器 的 顾客 ， 可 能 会 提出 这 样 的 问题 ， 在 我 们 前 面 对 性 能 优化 的 讨 
论 中 《第 5 章 )， 我 们 收 设 能 够 非常 准确 地 回答 这 个 问题 。 我 们 试图 把 程 学 移 CPE ‘每 元 素 的 周期 
数 ) 测量 从 精 确 到 小 数 点 后 两 位 。 对 一 -个 CPE 为 10 的 过 程 ， 这 要 求 精确 度 为 0.1%。 在 本 章 中 ， 我 
们 会 讲述 这 个 问题 ， 并 会 发 现 它 是 非常 复杂 的 。 

你 可 能 会 以 为 在 计算 机 系统 上 获得 几 近 完美 的 计时 测量 会 很 简单 。 毕 帝 ， 对 于 某 个 程序 和 数据 
的 组 合 ， 机 器 会 执行 国定 的 指令 序列 。 指 令 的 执行 是 由 处 理 器 时 钟 控制 和 的 ， 而 处 理 器 时 钟 是 由 精度 
振荡 器 控制 的 。 不 过 ， 一 个 程序 的 执行 与 男 一 个 程序 的 执行 之 间 有 许多 因素 是 不 同 的 。 计 算 机 并 不 
问 时 只 执行 一 个 程序 。 它 们 不 停 地 从 一 个 进程 切换 到 另 一 个 ， 为 一 个 进程 执行 一 些 代码 ， 然 后 则 移 
到 上 一 个 进程 。 对 -个 程序 的 处 理 器 资源 的 准确 调度 依赖 于 这 样 一 些 因 素 ， 例 如 共享 系统 的 用 户 数 
量 、 网 络 流量 和 对 磁盘 操作 的 计时 。 对 高 速 缓 存 的 访问 模式 不 仅仅 依赖 于 我 们 正在 试图 测量 的 程序 
的 引用 ， 还 依赖 于 同时 正在 执行 的 其 他 进程 。 最 后 ， 分 支 预 济 钼 辑 会 根据 以 往 的 历史 猜 济 是 否 会 选 
择 分 支 。 一 个 程序 每 次 执行 的 历史 都 不 相同 。 

在 本 章 中 , 我 们 描述 计算 机 用 来 记录 时 间 流 逝 的 两 种 基本 机 制 ; ~- 种 基于 低频 率 计时 器 (timer)， 
名 会 周期 性 中 断 处 理 器 ， 另 一 种 基于 计数 器 〈counter)， 每 个 时 钟 周期 计数 器 会 加 1。 应 用 称 序 的 种 
序 员 可 以 通过 调用 库 应 数 获得 对 前 一 种 计时 机 制 的 访问 。 有 些 系统 上 ， 可 以 通过 库 随 数 访 问 周期 计 
RAE (cycle timer)， 但 是 有 些 系统 上 需要 编号 汇编 代码 。 我 们 将 程序 计时 推迟 到 现在 才 讨 论 ， 是 内 
为 程序 计时 需要 理解 CPU 硬件 和 操作 系统 管理 进程 执行 的 方式 ， 

使 用 这 酚 种 计时 机 制 ， 我 们 来 研究 获得 程序 性 能 的 可 靠 测量 值 的 方法 。 我 们 会 看 到 ， 由 上 上下 
文 切换 引起 的 计时 变化 会 非常 大 ， 丁 此 必须 消除 。 由 其 他 因素 引起 的 变化 ， 例 如 高 速 缓 企 和 分 支 博 
测 ， 通 常 是 通过 在 精心 控制 的 条 件 下 执行 程序 操作 来 管理 的 。~- 般 来 说 ， 我 们 可 以 获得 对 于 非 党 短 
(小 于 大 约 10ms) 或 者 非常 长 (大 于 大 约 16) 的 时 间 段 的 准确 测量 值 ， 即使 是 在 负载 很 重 的 机 器 
上 。10ms~1s 之 间 的 时 间 要 想 准 确 测量 需要 特殊 的 处 理 ， 

许多 对 性 能 测量 的 理解 都 是 计算 机 系统 传说 的 一 部 分 。 不 同 的 小 组 和 个 人 开发 了 他们 自己 的 测 
量程 序 性 能 的 技术 ， 但 是 关于 这 个 主题 没有 广泛 流传 的 文献 。 那 些 专业 性 能 测量 的 公司 和 研究 组 ， 
第 常 建立 特殊 配置 的 机 器 , 使 得 造成 计时 不 规则 的 来 源 最 少 , 例如 ， 通 过 限制 访问 或 者 关 岳 许多 OS 
和 网 络 服务 。 我 们 希望 能 有 程序 员 在 普通 机 器 上 就 能 使 用 的 方法 ， 介 是 没有 这 样 的 广泛 可 获得 的 上 
具 。 所 以 ， 我 们 会 开发 我 们 自己 的 工具 。 

任 这 星 的 描述 中 ， 我 们 会 系统 地 讲述 这 些 问题 。 我 们 描述 估量 实验 的 设计 和 评价 ， 这 些 实 验 背 
助 我 们 获得 在 一 规模 系统 上 取得 准确 测量 的 方法 。 在 一 本 这 个 层次 的 书 中 找到 详细 的 实验 研究 还 是 
不 太 常 见 的 。 通 常 ， 人 们 只 想 要 最 后 的 答案 ， 而 不 想 知道 是 怎样 确定 这 些 答案 的 。 不 过 ， 在 这 里 
对 于 如 何在 任意 系统 上 测量 任意 程序 的 执行 时 间 ， 我 们 不 能 提供 确定 的 答案 。 有 大多 的 计 果 机制 、 
操作 系统 行为 和 运行 时 环境 ， 不 可 能 有 一 个 惟一 的 、 简 单 的 解决 方案 。 彬 反 ， 我 们 期 望 你 自己 做 冬 
验 ， 开 发 你 自己 的 性 能 测量 代码 。 我 们 希望 我 们 的 案例 研究 能 帮助 你 完成 这 项 任务 。 我 们 把 我 们 的 
发 现 以 协议 的 形式 总 结 出 来 ， 它 能 够 指导 你 的 实验 。 
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91 计算 机 系统 上 的 时 间 流 


计算 机 是 在 两 个 过 全 不 同 的 时 间 尺 度 Pd ETER. АЛАН, ПА IEE 
期 - -条 或 多 条 指令 的 速度 执行 指令 ， 这 时 每 个 时 种 周期 只 需要 大 约 Ins. GAAND 成 者 10%. EEM 
KE b. AbRESED AU P RESCUE, EPA ms (ER RA 07s ЖЕРШ. 
blm, dmm. XSIEBSL RUE BORED NS 33ms 0. ЕНЕ ЖЕНІЛ 
КНИГЕ КЕЕ 50ms -次 击 键 。 磷 各 通常 需要 大 约 10ms ER) ОА. YE 
宏观 时 间 凡 上 嵌 上 ， 处 理 占 不 个 地 在 许 名 任务 之 间 杞 换 ， 一 次 分 配 镁 每 个 任务 大 约 55-20. АВ 
的 速 吝 ， 用 户 感 常 上 任务 是 在 邮 时 进行 的 ， 因 为 人 不 能 够 察觉 短 于 大 约 100ms 的 时 间 段 。 在 这 段 时 
间 内 ， 椒 理 礁 可 以 执行 几 百 万 条 指令 。 

ІҢ 9.1 在 对 数 尺 度 上 向 出 了 务 种 十 件 类 型 的 持续 时 间 , 微 现 事 件 的 持续 时 间 以 ns 为 单位 ,大 ) 
7E 3 SETT ЕЖЕН, ms 为 竺 位 改 小 ) 宏 规 事 忻 是 由 OS PPE XE Pë], ЕЕ APJ 5 000— 200 000 
个 时 钟 冉 期 这些 时 间 郊 围 是 以 ys 来 测量 的 《 微 秒 ， 这 里 是 希腊 字符 “mu”)。 听 上 去 杂剧 是 很 
多 的 计算 Н к ША ОО 宏观 事件 要 快 很 和 多， 以 至 于 这 些 例 程 只 给 处 理 器 增 锅 了 少量 的 负 


RARE (1 GHz 的 机 器 ) 
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91 计算 机 票 统 事 件 的 时 间 尺 度 
ALLEE MM B R HE ETE. deux Ц C8 THREE [E RTL. ns ESRB. OS Ф OH E REDE RE HIE IW 
同 为 儿 ms ЕШ БН. 
练习 题 9.1 
ШАР ЕМАС 这 样 的 实时 编辑 器 来 编辑 文件 时 ， 每 次 主键 部 产生 一 个 中 其 信号， 然 后 ， 操 
作 系 统 必 须 调度 编辑 器 进程 ， 对 这 次 圭 键 采取 适当 的 行动 。 概 设 我 们 有 一 个 时 钟 为 | GHz 的 系统 ， 
而 我 们 有 100 AF P iE 4T EMACS, 他 们 以 看 分钟 100 个 单词 的 达 度 输入 .假设 每 个 单 词 平均 有 


个 字符 ， 还 假设 处 理 击 键 的 OS 例 程 平均 需要 100 000 外 时 钟 周期 / 键 ， 对 所 有 这 些 击 键 的 处 理 占 用 
了 处 理 骂 负载 的 百 分 之 多 少 ? 


注意 ， 这 是 对 键盘 使 用 造成 的 负载 非常 悲观 的 分 析 。 很 难 想 俐 现实 生活 中 有 这 么 多 输入 如 此 快 
ҚАР, 
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9.1.1. 进程 调度 和 计时 器 中 断 

外 部 雪 什 ， 和 例如 击 键 、 磁 盘 探 作 和 网 络 洛 动 ， 会 产生 中 断 信 号， 这些 中 断 售 号 使 得 换 作 系统 调 
度 程序 得 以 这 行 ， 可 能 还 会 切换 色 另 一 个 进 种 。 节 使 没有 这 样 的 事件 ， 我 们 也 希望 处 理 器 从 一 个 进 
程 切换 到 为 一 个 ， 这 样 用 户 看 上 去 就 好 橡 处 理 器 在 辣 时 执行 许多 程序 一 样 。 出 于 这 个 原因 ， 计 算 机 
8 个 外 部 计时 器 ， 它 周期 性 地 向 处 理 器 发 送 中 断 信和 号。 这些 中 断 信号 之 间 的 时 间 被 称 为 闻 隔 时 间 
(intervaltime). ТЕЕ РТУ ER, BRE ЖЖП 32 п] lk А ЕСИНЕ EU HI ЕЕ, 
TAPAKA ХТНЕОЯКЕНЕЕЕ, ОҢНАН AEEA ШЕ ЕЕ ИЖ. dE 
ЫНТЫ МЕНЕ. 5 Jm. АСФНЕНПЕЯН-ЦЗНЕЕ SLT ТЕН ЕЛ 
ЖАН ЕРЕ АКА, ТЕПЛЕ 308 КА, ЕНННЕРЕЯАЕНЕСӘЖНЫН Ж. 
根 揣 处 理 器 以 及 处 理 器 的 配置 情况 ， 典 型 的 计时 器 间 山 范围 是 41 一 10ms， 
mk. 计算 机 性 能 的 伸 纺 

将 Digital Equipment Corporation 的 VAX-11/780 计算 机 的 性 能 比喻 成 一 个 现代 处 理 器 ， 这 是 根 
有 意思 的 。 这 种 机 器 是 在 1977 FERH, 6 EL 06 200000 美元 ， 它 永 为 第 一 种 被 广泛 使 用 
的 运行 Unix 操作 系统 的 机 器 . 注 束 ,这 种 机 器 上 的 计时 嚣 间 陋 黄 型 地 被 后 团 为 10ms, 即使 它 的 CPU 


出 现代 机 加 的 CPU Т О 1000 42, ХИИ LR UE d 4bfE eh. qe ИА З EUR SUE K 
£. 


图 92 (а) 从 系统 的 角度 说 时 了 在 计时 器 间隔 为 10ms 的 系统 上 -个 假设 的 150ms 的 操作 。 在 
这 段 时 间 为 有 了 遇 个 活动 的 进程 : A 和 B。 处 理 器 父 社 地 执行 进程 和 的 部 分 ， 然 后 髓 执行 B 的 一 部 
分 ， 恢 尼 类 排 。 妆 处 理 蝇 执行 这 些 进 称 时 ， 它 要 各 运行 在 用 户 模式 ， 执 行 应 用 程序 的 指令 ， 要 么 运 
行 在 内核 模式 ， 代 圾 程序 执行 拒 作 系统 琐 数 ， 例 如 处 垦 缺 页 、 输 入 或 者 输出 ， 回 想 К. НЕВЕ 
被 认为 应 每 个 普通 进程 的 一 部 分 ， 市 不 是 “个 狐 立 的 进 称 。 每 次 有 外 部 事件 或 者 计时 器 中 断 时 ， 部 
会 调用 操作 系统 凋 度 黎 序 。 在 疼 中 ， 计 时 器 中 断 的 发 生 是 由 短线 标记 来 表示 的 。 这 瘟 味 着 在 每 个 短 
线 标 岂 处 部 有 一 - 些 内 核 活动 ， 人 各 是 为 了 简 使 ， 在 图 中 我 们 没有 显示 。 

са» Sf 
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9.2 系统 和 应 用 对 时 间 的 看 法 
RAM PEIUS “个 进程 ， 这 些 进程 运行 在 用 产 模 式 或 者 内 核 模式 ， 当 应 用 的 进程 在 用 户 模式 中 执行 时 ， 应 用 才能 
下 成 有 出 的 计算 ， 

"ТИЕТ Aa A 切换 到 进程 В, НАА ТОНЕ А ТКЖ ОЛ АЗЕ 
进程 A 的 -部 分 )， 然 后 恢复 进程 B 的 状态 《被 认为 是 进程 B 的 -部 分 }。 因此， 在 每 次 从 一 个 进 
КОШУ; 个 进程 期 辣 ， 是 有 内 核 活动 的 ， 在 其 他 时 候 ， 也 有 除 了 切换 进程 之 外 的 内 想 活 动 ， 斧 
ШИНАЕН 一 个 已 经 在 存储 器 (memory) ШЧ ДЕ Л ШМ. 
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912 ”从 应 用 程序 的 角度 看 时 间 

从 应 用 程序 的 角度 出 发 , 村 以 把 时 间 流 看 成 两 种 时 间 段 的 交替 , 一 种 时 间 段 里 程序 旦 活动 的 《在 
执行 它 的 指令 }， 男 一 种 时 间 段 时 程序 是 不 活动 的 《等 待 被 操作 系统 调度 }。 当 应 用 的 进程 运行 在 用 
户 模式 中 时 ， 应 用 才能 执行 有 用 的 计算 。 图 92 (00 说 明了 程序 A 晨 如 何 看 竺 时间 流 的 。 在 深 京 色 
区 域内 应 用 是 活动 的 ， 此 时 进程 A IEAERIP Bop BUT. ERAT. 

作为 一 种 量化 在 活动 和 不 活动 时 间 段 之 间 变 普 的 方法 ， 我 们 写 了 一 个 程序 “， 它 不 断 地 监视 它 
自己 ， 确 定 什 么 时 候 有 长 的 不 活动 时 间 。 然 后 它 产 生 一 个 trace (跟踪 广 件 )， 显 示 出 在 活动 和 不 活 
动 时 间 段 之 辐 的 变声， 本 章 后 面 会 描述 这 个 程序 的 细节 。 图 93 展示 了 一 个 这 样 的 trace 示例 ， 是 在 
一 个 时 钟 周期 大 约 为 550 MHz 的 Linux 机 器 上 运行 时 产生 的 。 每 个 时 间 段 都 标记 为 活动 的 СА”) 
"йн АРЫ ("I”)。 轩 间 段 被 编号 为 0~9， 几 来 标识 。 对 于 每 个 时 间 段 ， 纵 出 了 开 妈 时 间 “相对 
T trace 的 开始 ) 和 持续 时 长 。 以 时 钟 周期 和 ms 来 表示 时 间 。 这 个 trace 一 共 显 示 了 20 个 时 间 段 (10 
个 活动 的 ，10 个 不 活动 的 )， 总 共 的 持续 时 间 是 66.9 ms。 在 这 个 例子 中 ， 不 活动 时 间 段 相当 短 ， 最 
К 0.50 ms。 人 多数 不 活动 时 间 段 是 由 计时 嚣 中 断 造 成 的 。 被 监视 的 总 时 间 中 ， 大 欧 95.196 PRI 
间 这 个 进程 都 是 活动 的 。 图 94 展示 了 图 93 所 不 的 trace 的 图 形 化 表示 。 注 意 ， 灰 色 三 角形 指明 了 
活动 时 间 段 之 间 边 界 的 规则 间隔 。 这 些 边界 是 击 计 时 器 中 断 造 成 的 。 


AO ЯШ 3 (0.00 ms) ЕА) 2726508 (6.776448 тз) 
IO #8 3726508 {6,78 ms), 持续 时 间 275025 (0.500118 ms) 
Al BH 4001533 (7.28 ms] AED BI 0 (0.000000 ms) 
Il #9] 4001533 (7.28 ms), 持续 时 间 7598 (0.013817 ms) 
A2 EM 4009131 (7.29 ms) Ja 5189247 (9.436358 ms) 
I2 ЫМШ 9138373 (16,73 ms), 持续 时 间 251609 [0.457537 ms) 
АЗ #8] 9449987 (17,18 ms) Hs 2250102 (4.091686 ms) 
ІЗ #1] 11700089 121.28 ms), 持续 时 间 14116 (0.225669 ms) 
А4 А] 11714205 [21,30 ms), ANE 2955974 (5.375275 ms) 
14 ЖЫН 14670179 126.68 ms) 持续 时 间 248500 (0.451883 ms) 
А5 ЖШ 14918679 [27.13 ms), ЕРЕ] 5223342 (9.198358 тз) 
I5 时 间 20142021 136.63 ms), 持续 时 间 247113 (0.449361 тв) 
A6 AH) 20389134 137.08 ms), MANI 5224777 [9.500967 ms) 
IG ҚЫН 25613911 (46,58 ms), 持续 时 间 254340 (0.462503 ms) 
A7 #18] 25868251 (47.04 ms) FAR 2678102 (6.688425 ma) 
17 Hj] 29546353 (53.73 ms) 持续 时 间 8139 (0.014800 ms) 
АВ #8] 29554492 153,74 ms), AMA) 1521187 (2.784379 ms) 
ІН 时 间 31085679 156.53 ms), 持续 时 间 248367 (0.451629 па) 
A9 Ж] 21334039 (56.98 ms), HH 5223581 (9.498792 ms) 
I9 Hj] 36557620 (66.48 ms), 持续 时 间 247395 (0.449874 ms) 


693 显示 活动 时 间 段 的 示例 trace 
从 应 用 程序 的 角 短 来 看 ， 处 理 跟 了 哥 作 是 在 程序 活动 执行 【以 插 体 费 示 的 ) 和 不 活动 之 间 交 炉 进 行 的 。 这 个 race 展示 了 一 个 程 
序 在 66.9 ms 时 间 段 内 耳 种 时 间 段 的 日 志 记 录 。 有 ОЗІ НІНЕН Бу. 


ІН 9.5 展示 了 一 个 trace 的 -一 部 分 ， 此 时 还 有 另 一 个 活动 进程 在 共享 处 理 器 。 图 9.6 中 展示 了 这 





2 即 下 文 提 基 的 趴 踪 进 程 ， 一 一 译 首 
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个 trace PAER. ЕК, ЮЙРЕНЕ ДЛ Л Р, EDARID BD AK тасе ARN 
进程 的 349.40 ms 处 开始 的 。 仁 这 个 屋子 中 ， 我 们 可 以 看 到 ， 丰 处理 某 些 计 半 器 中 断 时 ，DS 也 会 次 
定 从 一 个 进程 切换 上 和 下文 到 男 一 个 进程 。 央 三 ， 每 小 进程 只 会 让 大 约 50% ЕЕН E at ЕТЕ]. 


AARE 3Ж = 1 


| [| 活动 的 

— ASTE 

— T AÀ 

Ü 10 20 30 40 50 60 TO 80 

ЕТІН) (ms) 
E94 8 73 фасе 的 图 形 化 表示 
计时 器 中 断 基 出 灰色 三 角形 来 指示 的 。 

А48 — f] 191514104 (349,40 na), ÉE] 5224961 (9.532449 ms) 
148 жі 136719065 (358,93 па), ЖНЕЫЕ | 247557 — (0.151644 ms) 
A49 ҰЯ) 196986622 (159.38 ms), ЯЯЫШ 858571 (1.566182 ms) 
T49 Bj id] 197825193 (360.85 ma), Ж] 8297 10.015137 те! 
А50 — KE 197853490 (360.97 ma), ААР) 4357437 (7.949733 ms) 
I50 МІ! 232210927 (368.91 ms), ФКА] 5728758 :10.433335 ms) 
A5 А] 207929685 (379.35 ns), ЖЯНЙ 2047118 (3.734774 ms) 
151 ”时间 209976803 (383,08 ms), 持续 时 间 7153 10.013050 ma) 
A52 BJ 209983956 (393.10 па), ФАА 3170650 (5.784552 ms) 
152 Ж 213154606 [388.88 ms), ЖНШИ 5726129 :10.446793 ma) 
А53 Ж 2189880735 (399.33 па), ЖЯНИ 5217543 (9.518916 ms) 
153 时间 224098279 (408.85 ms), 和 持续 时 间 5718135 110.432199 ms) 
А94 ЖИН) 228815413 (419,28 ms), ӘР] 2359281 [4.204286 ms) 
Tod ”时 间 232175694 (423.58 ms), 持续 时 间 /Ü96 — (0.012946 ms) 
A55 ЯН) 232182790 (423.60 ms), ФАР] 2859227 (5.216390 ms) 
T55 Жі 235042017 (428.81 ms), 持续 时 间 5718793 110,.433399 ma) 


25 显示 有 负载 机 器 上 的 活动 时 间 段 的 示例 Trace 


当 还 有 其 他 活动 进 栏 存 在 时 ， 跟 踪 进 程 会 较 民 时 间 椒 活动 。 这 个 иже 展示 了 ARTT AA 89. Воп ИНЕҢ ШИНА. 
FR Eid Pa fE 53.09 [a] P3 c 6 АЙТ. 

55 9.2 

这 个 问题 是 关于 图 9.5 所 示 trace 的 一 部 分 的 解释 的 ， 

A. 在 这 部 分 trace 中 ,什么 时 候 发 生 了 计时 器 中 断 ? (其 中 有 些 时 间 点 能 够 直接 从 trace 中 提取 
ШЖ. ФАШ ДИНА И.) 

B. ЖИЕ ТР, ОЕ УЕНЫ ЫН OA Ж, ЕДЕ ЕЖ ЕЁ}? 

C. ЭТ 2 8 K) 2E sb W S ШЕ 8 K dk н is] Et Ж 96? 
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D. 根据 这 个 trace Р Ж 2236 T$ Бү їп ЕЗ, ir Ж Kg np RS А, RREA T 
不 活动 状态 的 时 间 百 分 比 会 是 多 少 ? 
АНЕ. fg =2 


ШО; 
ШЕГІ 
0 10 20 З) 40 20 80 79 80 
时 间 (ms) 


图 ?6 图 9.5 中 froce 的 活动 时 间 段 的 图 形 化 表示 
НЕН ЕЁ 7 foem n. 


9.2 通过 间隔 计数 (interval counting) 来 测量 时 间 


操作 系统 也 用 计时 器 《timer) 来 记录 每 个 进程 使 用 的 累计 时 间 ， 这 种 信息 提供 的 是 对 程序 执行 
irr BAN AE Е WERE. 图 97 {ТШМЩ 92 中 所 示 的 系统 操作 示例 进行 这 种 记 账 
《accounting> 的 畦 形 化 说 明 。 在 这 里 的 讨论 中 , 我 们 称 只 有 一 个 进程 在 执行 的 一 段 时 间 为 时 间 攻 (time 
segment) ^. 
(a) (е 


B FUOU + 30% 
Wu Ау Ац Ав B, Bs Bu Бі. Bu Bu As ач Aa ñu mn іп Ba Bu B. Ba А! А Ап Ag Ав 


(b) 实际 时 间 


RT A | A | A 12000 + 333 
Р 290 2335 


9./ 通过 同 隔 计数 【inferval counting】 来 对 进程 计时 

计时 器 何 隔 为 10ms 时 ， 每 10ms 时 间 禹 被 分 配 纵 一 个 进 黎 ， 作 为 它 的 用 户 时 间 GO. 或 者 系统 时 间 GO 的 -部 分 这样 的 记 
HK Caccounting? ЕННЕВНАТТЕКІНІН ТН ЕЕ. 
9.2.1 操作 

БУРАНЫ ЖЕ ИЕН РА MERR НЕНИН. CERE РЕ ЕЕН. He 
作 系 统 会 确定 哪个 进程 是 活动 的 ， 并 且 对 那个 进程 的 一 个 计数 值 增 加 计时 器 间 酷 时间。 如 果 系 统 是 
作 内 恢 模 式 中 执行 的 ， 那 么 就 增加 系统 时 间 ， 否 则 就 增加 用 户 时 间 。 图 9.7 (a) 所 水 的 例子 表明 了 
对 两 个 进程 的 这 种 记 账 《accounting)。 短 线 标记 表明 发 生 了 计时 器 中 断 。 每 个 计时 器 中 断 都 山 被 增 
ЛОВУ ЧЕ ЖА: БОЯ ДҮ A 的 用 户 或 系统 时 间 Au 或 As， 或 者 是 进程 B 的 用 小 或 系统 时 间 


3 通常 称 为 时 间 片 。 一 一 译 者 


566 %9% 


Bu 或 Bs. SPTigfkb Ii S E BON ЕК ОН ЖЫНЫН. ЕЛІМ АК & BH SRE А 总 共 司 用 
f 1508: 110ms 的 用 户 时 间 和 40ms 的 系 综 时 间 :， 进程 B 总 共 使 用 100ms，370ms mf] РЕ (LIC 
30ms [Ё} ЖЕ [8] , 


9.2.2” 读 进程 的 计时 器 
当 从 Unix shell 执行 一 个 命令 时 , 用 户 可 以 在 命令 前 加 上 单词 “time”， 玉 测量 命令 的 执行 时 间 ， 
这 个 命令 使 用 有 的 值 是 用 上 面 描述 的 记 账 方法 计算 出 来 的 。 例 如 ， 为 了 计算 命令 行 参 数 为 -n 17 的 种 
E prog 的 执行 时 间 ， 用 户 只 要 简单 地 输入 从 令 ， 
Jnix» time prog -n 17 
ТЕЛЕТ НЕЕ, shell ТЕН АА ЕМІНІҢ ІЕІН-Т. ЖӘ Funk ae: 
2.2340 0.2605 0:06.52 28.1% O0«0k (+010 BÜpfs«Qw 
СТН ЭСЕЛЕК}. BC ЕШР ЖЖЖ ЕН Ж. ЫЛАУ 
КЖ. УЖЕ 0. FARRA 10 ms, MARTHE ЯС PREA. W CTS 
ШШЕН), БАЗ КЕ 6 lH: EB EO И ГЕНДИ ЖА: 2.495, His А ӘЛІНЕ 
6.52s 鸭 一 半 还 要 人 少 ， 这 表明 处 理 器 同时 和 还 在 执行 其 他 的 进程 。 АЛЕК ВРА ЖӘЕП ЕР 
ШЕН ШЙ, ЖШ, (2.23 + 0.26)у/6.52 = 0.381。 剩 下 的 统计 数据 总 结 了 页 面 调度 和 TO 行为 。 
程序 员 壕 可 以 通 这 调用 库 函 数 times 来 读 进 程 的 计时 器 ， 这 个 函数 的 声明 如 下 : 
include «sys/times.h- 
struct tms f 


clock L tms utime; /* user time %/ 
ciock t tms stime; /* system time */ 


ciock t tms cutime; /* user time of reaped children */ 
clock L tms cstime; /* system time of reaped chiidren */ 
}; 


clock r timesístruc- tms *butf'; 


ы; ДА sby k pilay + АЛИ. 

БЕ] [8] НЕДЕ Р Ж. (clock tick) 为 单位 来 表示 的 。 定 义 的 常数 CLK_ TCK 指明 每 秒 
ТҮЛЕН TEL. 数据 类 型 clock_t 通 东 定 闪 为 长 整 型 。 指 明子 时 间 的 字段 给 出 的 是 已 经 终止 了 并 且 被 
可 路 了 的 子 进程 性 用 的 累积 时 间 。 因 此，times 不 能 用 来 监视 任何 正在 进行 的 了 进程 所 使 用 的 时 间 。 
作为 返回 值 , times 返 思 的 是 从 系统 后 动 开 始 已 经 经 过 的 时 钟 滴答 总 数 。 因 此 我 们 可 尽 通 过 两 次 旋 用 
imes HHT TERARI, 来 计算 个 程序 执行 中 两 个 不 同 点 之 间 的 总 时 则 《以 时 钟 滴 管 为 单 
[i o. 

ANSI C ЖЕЕ X, T —F clock 图 数 ， 它 测量 当前 进程 使 用 的 总 时 间 | 


#1пс1ийе «time.h- 





clock t clockivoid): 


| ақ; HEFE NIS, 
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[8] [5.58 f; Д-Н. ОҢ clock 函数 撕 告 的 时 间 变 成 种 数 ， 必 须 把 它 除 以 定义 好 的 常数 CLOCKS_ 
PER_SEC。 这 个 常数 慎 木 一定 要 和 常数 CLK TCK 相同 。 
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如 图 9.7 所 本 的 示例， 这 个 计时 机 制 上 只 是 近 羽 的 。 图 9.7 (b》 展 示 了 两 个 进程 实际 使 用 的 时 间 。 
进程 A 总 上 共 执 行 了 153.3ms, 其 中 用 户 模式 120.0 ms, 内 核 模式 33.3ms。 进程 总 共 执 行 了 96.7ms， 
其 中 用 户 模 式 73.3ms， 内 核 模式 23.3ms。 采 用 间隔 计数 的 记 账 Cinterval accountin MEN TAE 
什 时 器 间隔 【timer interval 方法 更 好 地 解决 时 间 问 题 。 


练习 题 9.3 
操作 系统 会 怎样 报告 下 面 所 示 执 行 序列 的 用 户 和 系统 时 间 ? 假设 计时 器 间隔 为 10 ms. 


LA | 8 1 AG B | A | 


5 9.4 
Е-РЗҢНЕНЫЛ 10 ms £L. VA nk AARRE $ m, GE E 
ӨҢРЕІЕ, UA At | л Кей ЖЕНИ 2 $ yo 


ЖЫШ 9.5 

对 于 图 9,2 中 所 示 的 trace, НІНЕ (counter) 35K # ЖМ B] Р a8] ex $ 077 这 个 时 间 
与 进程 处 于 活动 状态 的 实际 时 间 之 比 为 多 少 ? 

对 于 运行 时 慑 是 够 长 的 程序 CR ID E Др), 这 种 方法 中 的 不 准确 性 就 能 相互 弥补 了 。- epi 
ШЕНІНЕ НЕН T. mn ERA. 在 许多 时 和 间 段 上 -平均 ， 期 望 的 误差 就 接近 于 0 了 。 
不 过 ， 只 理论 的 角度 来 看 ， 对 于 这 种 测量 什 与 真实 运行 时 间 的 差距 有 多 人 和， 六 没有 确切 的 界限 。 

为 了 测试 这 种 计 机 方 祛 的 谁 博 性 ， 我 们 运行 了 一 系 庆 实验， 比较 相同 样本 计算 上 操作 系统 所 测 
ЖҮН Т„ 和 如 果 系 统 资源 只 用 来 执行 这 个 计算 时 我 们 估计 的 时 间 工 。 一 般 而 埋 ，T. 与 T, 不 相间 有 
Ш ГРЛА: 

|, Ila VE RC E93 SU EE] APTE RR PE n] DER Т, Т, Хае K. 

2. ИДЕН ТЕК ЛЕН ГА CPU 周期 的 496—596, BERRES ЕР ER 
121, ШМА 94 ВТ trace 中 可 以 看 到 的 邦 样 ， 这 个 活动 在 下 一 次 计时 器 中 断 之 前 结束 ， 因 此 
没有 显 式 电 修 算 进 去 。 相 反 ， 它 只 简单 地 减少 了 下 一 个 时 间 间 隔 内 执行 说 程 的 可 用 周期 数 。 机 对 于 
T.， 这 就 增加 了 Ta- 

3， 汉 处 理 器 从 一 个 任务 切换 到 蚊 一 个 任务 时 ， 在 一 个 短暂 的 时 间 内 ， 高 速 缓存 可 能 会 执行 效率 
很 过 ， 和 直到 新 任务 的 指令 和 数据 被 加 载 到 高 速 缓 存 中 。 因此， 当 人 处 理 器 在 我 们 的 程序 与 其 他 活动 之 
间 切 换 时 ， 它 的 执行 效率 没有 连续 执行 我 们 程序 时 的 效率 高 。 相 对 于 T.， 这 个 因素 会 增加 TT,。 

任 本 章 后 面 ， 我 们 将 讨论 如 何 确定 我 们 天 例 计 算 的 工 . 值 。 

图 9.8 给 出 了 在 两 种 不 同 的 负载 条 件 下 运行 这 个 试验 的 结果 。 这 些 曲 线 图 展示 了 我 们 的 误差 率 
НШІ ЕНЕ, 它 定义 为 全 .的 一 个 函数 (TY, - ЕУ, 48 «28 Т, АРЕ ЕТ, В, ЕНЕ, 
当 TAHNAT T. 时 ， 它 为 正 ， 两 绍 数 据 显 示 的 是 在 两 种 不 同 负载 条 件 下 测量 的 值 。 标 号 为 “ 负 
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载 1” 的 那 组 数 撕 显示 的 是 傣 行 示例 计算 的 进程 是 恰 一 活动 进程 时 的 情况 。 标 号 为 “负载 11” 的 那 
组 数据 显示 的 是 另外 还 有 10 个 进程 也 在 试图 进行 同样 的 计算 时 的 情况 :后 者 代表 的 是 一 个 负载 非常 
重 的 情况 ， 系 统 对 市 键 和 其 他 服务 请 求 的 顺应 明显 慢 了 ， 注 意 ， 这 幅 疼 中 显示 的 误 苦 值 东 围 很 人 。 
一 般 而 过 ， 具 有 在 真 实 倩 土 10% 范 围 内 的 测 昌 值 才 是 可 接受 的 ， 因 此 我 们 兵 希 望 误差 变化 范围 为 人 
£j -0.] 740.1. 

Intel Pentium 11. Linux, HEHE% 





0.5 ' а ао 
0.4 43 


Ü 3 ke — = L L= L + "= ІН y RA 
' 





REM ПП: HERRIEI [Е] 
e 
x 
> 


БИЕ CPU mí (ms) 


图 ”8 测量 间隔 计数 《irierval counting) 的 准确 性 

ЭШЕН hg K£) 100 ms СОНЫНА) Н, З ЕР ы. EUR д АЛАТИ Я [Ги СОАК Do (SEL 
5), bh ДЕЕ (НДЕ F COS 1D. GEI F 10%. 

fT KJ 100ms CIO ИЕН. ШКЕ b ЕЕЕ, Е КН. ІН ҮР Н АЙ 
ЖНА И $——— 100 000 000 ^P EET SERE E %---ЯН. ЕК, RIMER SUAE C 
0.00.1 之 间 ， 也 就 是 ， 最 多 有 ERA. МА МЕНІ Ж Н, (ШУТ НН RID]. 954% 
НАТ, ЖЕП: ЖҒИТЯ Т,2100 ms КҮЙІНІҢ, FERES 1.04, AEEA iTia Ч Ту 
Hi T AZ 4%] CPU 时 间 。 

ix Hosp d de THERE VE LAS ROSE ЗА FFE АЕ НУЛЕ У A. ЕЛІНЕ KH, PAER TEEN 
间 小 于 100ms AWE. FRANA D. Ж ЖН ААЖ, xs M d EIN ISI. EXER 
214%. JUMP Vp SEL REIS] L DL ca CLIE FRI Re ГЕ НГ АЯҚ, 


93 ЮЛЛА 
为 了 给 计时 测量 提供 更 高 的 精确 度 ， 许 多 处 理 器 还 包含 一 个 运行 在 时 钟 周期 级 的 计时 器 。 这 个 
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КЕ CREEK EARR Е Аре 1. ЯДЫ ЖЕЛИ КОХ А Vr COR IE] 
ІҢ. AERA KEERA CREE iL Sr anu, о ПЕЕ ЖК АКИ ES Е ЗС ВЕ ЯН Т ІҢ Ж АНЫ). 
К . ЖЕНА ЛАН B Бп ЖА ИЕП ИЕК. mo 20, АЙРИН WV. 
ЖАААТ ЕНЕ -个 程序 接口 。 


9.3.1 1432 周期 计数 器 

SJ Fm Ard, 我 们 已 经 报告 的 所 有 计时 值 都 是 用 1A32 周期 计数 器 (cycle counter? 测量 出 来 的 。 
在 1A32 体系 结构 中 ， 周 期 计数 露 是 与 “P6” 微 体系 结 梅 〔PentiumPro 及 其 后 续 产 品 ) 一 起 提出 来 
的 。 周 期 计数 中 是 个 64 位 无 符号 数 。 对 于 -- 个 运行 时 钟 为 1 GHz 的 处 理 器 ， 只 有 在 每 1.8 X10" 
秒 ， 或 者 每 570 年 ， 这 个 计数 器 才 会 从 2”- 1 绕 回 到 0。 另 一 方面 ， 如 果 我 们 只 考虑 这 个 计数 器 的 
低 32 人 刀 ， 把 它 看 成 一 个 无 符 与 整数 ， 那 么 这 个 值 会 大 约 每 4.3 FEES. X. BUE RPI 了 为 
(ІР. 1A32 鸭 没 计 者 会 决定 实现 一 个 64 br EE Б. 

[A32 计数 器 是 用 rdtsc (read time stamp counter， 读 时 间 蕉 计数 器 】 指 令 来 访问 的 。 这 条 指令 没 
8 ек. CR TT ей 设置 为 计数 器 的 高 32414, Т Фе RE NIK 3245. ЯА -T 
C 程序 接口 ， 我 们 想 把 这 个 指令 包装 到 一 个 过 程 中 : 





void azcess counteriunsigned *hi, unsigned “ісі; 


这 个 过 程 应 说 将 位 置 hi PEEL See 3245 K lo Em 324. ER 3,15 节 中 描述 的 
GCC НКА SEE, SER, access counter 很 简单 。 其 代码 如 图 9.9 Біл. 


code/perficlock.c 
1 тате the cycle counter */ 
2 static unsigned сус_һ1 = 0; 
3 static unsignec сус lo = 0; 
1 
5 
5 /ж Set *hi and *lo to the high and low order bits of the cycle counter. 
7 Implementation requires assembly code to use the rdtsc instruction. */ 
B void access counte-[unsigned *hi, unsigned *15) 
3 i 
10 asmi"rdtsc; movl *%ecx,%0; movl &*sax,*&1"  /*Readocycle counter */ 
11 S "=P" d*hil, "zr" 1510) /* and move results to */ 
12 : /* No input */ /* the two outputs */ 
13 : "Sedx", "еах"); 
14 ] 
15 


16 /* Record the current value of the cycle counter. */ 
17 vold start counterí) 


18 1 
19 access counrer(kCyc_ ni, kcyc lo); 
20 } 


570 %9% 


à е Return the number of cycles since the last call ta start counter. */ 
23 dou»le get counterí] 

да [ 

25 unsigned ncyc hai, ncyc |o; 

2E unsigned hi, lo, borrow; 

27 double result; 

at 

26 f* Get cycle counter */ 

30 access counteríkncyc hi, sncyc_lo); 

31 

32 ѓе Do double precision subtraction #7 

33 lo = ncyc lo - сус lo; 

54 borrow = lo > ncyc lo; 

35 hi - ncyc hi - cyc hl - borrow; 

35 result = (double) hi * {1 << 30) * 4 + lo; 
11 if (result < 0) í 

38 tprintf(stderr, "Error: counter returns neg value: $.02\n", result); 
39 } 

40 reLurn result; 

4 h 


code/perffclock.c 
8199 EM А32 周期 计数 路 的 程序 接 吕 的 代码 
п ИТА SEE i SE y>. 
A F jg F Ит. ВЕНЕ ЧО ЗИ Л, AR ЖИЕ МКІН 2 [8] ДЕК 


tinclade "clack.h" 
“СТЦ start counczerií); 


dcubls get. counczer!]: 
返回 : ВАА ЖЛ AG Sk ЖЕРТ DE ДА. 
我 们 退回 的 时 间 是 double 类 型 的 ， 以 避免 只 使 用 32 Ж a BE Die E e Н И. XC I DERE 
的 代 合 也 显 祭 在 图 89 中 。 它 是 建立 在 我 们 对 执行 双 精 度 减法 和 将 结果 转换 成 double 类 型 的 励 符号 
ie VE) PUE) SERE FT. 


9.4 用 周期 计数 器 来 测量 程序 执行 时 间 


周期 计数 丹 (cycle counter) 提供 了 一 个 非常 精确 的 工具 ， 可 以 测量 -- 个 程序 执行 中 了 商 个 相同 点 
之 回 结 过 的 时 间 。 不 过 ， 典 型 地 ， 我 们 对 测量 执行 其 段 特 殊 代码 所 需要 的 时 间 感 兴趣 。 我 们 的 岗 期 
Vr SCA |p A A H start, counter 和 调用 get. counter 之 间 总 的 周期 数 。 这 些 例 程 不 记录 嘟 个 进程 使 
用 这 些 周 期 ， 或 者 处 淮 器 是 在 内 核 还 是 在 用 户 模式 中 运行 的 。 在 使 用 这 样 的 测量 没 备 来 确定 执行 时 
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间 时 ， 我 们 必须 很 小 心 。 我 们 研究 一 些 其 中 的 困难 之 处 ， 并 看 看 如 何 殉 服 它们 。 

作为 一 个 司 用 周期 计数 器 的 代码 示例 ， 图 9.10 中 的 钢 程 提供 了 -一 个 确定 处 理 器 时 钟 者 率 的 方 
法 。 在 儿 个 系统 上 ， 以 参数 sleeptime 等 于 1 来 测量 这 个 函数 , ШЕН ЕНЕ ИЕ ТИНЕ AEE A Rb 
理 器 评测 性 能 的 1.0% 范 围 之 内 。 这 个 示例 清楚 地 表明 我 们 的 例 程 测量 的 是 经 过 的 时 间 ， 而 不 是 其 个 
进程 使 用 的 时 间 。 当 我 们 的 程序 调用 sleep М, МЕХА “ӘН, BP 15 的 睡眠 时 间 到 
达 。 这 期 间 经 过 前 周期 是 被 其 他 进程 执行 的 。 


cCode/perf/clock.c 
1 А Estimate the clock rate by measuring the cycles that elapse */ 
2 Р while sleeping for sleeptime seconds */ 
3 double mhz;int verbose, int sleeptime! 
4 . 
5 double rate; 
5 
7 start _ counter); 
H sljeep(sleeptime); 
3 rate = geb counterí() / (le6*sleeptims!; 
19 LË (verbose) 
11 printfí('Processor clock rate “= $.1f MHz'in", rate); 
lz return rate; 
13 ) 
codelperj/clock.e 


图 9Л0 函数 mhz: 确定 一 个 处 理 器 的 时 钟 频率 


9.4.1 上下文 切 换 的 影响 
测量 某 个 过 程 记 的 运行 时 间 的 一 种 简单 方法 就 是 用 周期 计数 器 来 对 P 的 一 次 执行 进行 计时 ， 就 
В РИК В: 
1 double time Р() 
2 { 
1 start_counter(); 
4 pU; 
5 return get counteri); 
b 


) 

MAE РТК САТЕ |ң, НАЕ НЕВЗАТ Т, MARRREREA D ES AR 
解 的 结果 。 如 朵 机 器 负载 很 重 ， 或 者 如 果 P 的 运行 时 间 特 别 长 ， 这 就 特别 成 问题 。 图 9.11 说 明了 这 
一 现象 。 其中 展示 了 反复 测量 一 个 程序 前 结果 ,这 个 程序 计算 的 是 一 个 131 072 个 整数 的 数组 的 和 。 
БЕКЖАН ТИ ms ABE. HEROS INDIES 36 ms， 比 计时 器 间隔 值 大 。 我 们 进行 两 级 测 
量 ， 每 组 对 问 一 个 过 程 测 量 18 次 。 标 号 为 “负载 1” 的 那 组 数据 说 明 的 是 在 负载 很 轻 的 机 器 上 的 运 
行 时 间 ， 此 时 机 器 上 只 有 -个 进程 在 运行 。 所 有 的 测量 值 都 在 最 小 运行 时 间 的 3.4 弦 范围 之 内 。 标 号 


4 操作 系统 根据 计时 器 间 隐 的 值 来 执行 进程 调 库 。 一 一 主考 
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3 "fox 4" ИЛИМИЖІНМДЕМ ИЕ — BEER СРО ATAS ЕТЕ ZF us ДЕҢ ІІБ 
行 时 间 。 头 七 个 样本 的 时 间 在 负载 1 PELA HL ER P EP] 2635120, 但 是 其 他 的 时 间 比 和 .3 售 还 
£, 

Е Т РЕ ІЛЕ, ЕРУ ИТЕ А з А А. WR- Titre wi u 7. 
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测量 示例 ， 大 数组 
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ЕРЛІ 在 不 同 的 负载 情况 下 ， 对 长 持续 时 间 的 过 程 的 测量 

Т АФИНА EL. ЁЛ ЖИ Д- - 致 的 ， 但 是 在 一 个 负载 很 重 的 系统 E. EMRE AE P BUT mE SL 
He I. 
942 ”高 速 缓存 和 其 他 因素 的 影响 

НА ИТ MAERA E KERERE Dp E, Fe BL E. I 9.12 E 
A T RAD, T Bl 9.11 中 的 测量 值 , 区 别 在 于 数组 要 小 4 倍 ， 得 到 的 执行 时 间 人 约 足 8ms。 这 些 执 
行 时 间 偿 计时 器 间 粒 要 短 ， 因 此 执行 不 太 可 能 受 土 下 文 切 换 的 影 味 。 我 们 看 到 测量 值 有 变化 ， 查 是 
这 鱼 变 化 的 程 庶 孝 没有 下 下文 切 换 造成 的 变化 那么 大， 

8 9.12 所 下 的 营 化 主要 是 册 禹 速 缓存 造成 的 。 执 行 一 个 代码 的 本 间 可 以 下 常 依赖 于 在 于 始 块 
行 时 ， 这 个 代 翅 使 用 的 数据 和 指令 是 否 在 数据 和 指令 高 速 姐 存 中 。 

作为 “ҮЗ, BS 了 两 个 一样 的 程序 ргосА ApoB, ШАЛ- 4258 82 Jj double * 的 指针 ， 
开 昌 将 从 这 个 指针 开始 的 8 个 连续 的 元 素 设置 为 0.0。 我 们 测量 以 -个 不 同 的 指针 bl. b2 和 b3 对 
这 个 过 程 进行 调用 的 时 钟 周期 数 。 谢 用 序列 和 得 到 的 测量 值 如 图 9.13 所 水。 凤 使 这 些 调用 执行 的 是 
完全 肯 亲 的 计算 ， 计 时 的 变化 也 几乎 有 4 倍 。 因 为 这 段 代 码 中 没有 条 件 分 支 ， 所 以 我 们 可 以 断定 这 
ЖБ Re SE nu ӨЕ [ҮЛҮ МЕДИ. 
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图 9.12. 在 不 同 的 负载 情况 下 ， 对 短 持 续 时 间 的 过 程 的 测量 
FERRARA 中 的 变化 那么 大 ， 亿 是 还 是 大 得 不 可 接受 ， 


БРГОСА(ҺВ1) 


roca b) 
procA:b3] 
procA hl] 
procBibl) 
procBib2] 


Bu 9.13. 相同 的 过 程 在 相同 的 数据 集 上 的 测量 序列 
这 些 测量 信 中 的 变化 主要 是 由 指令 和 热 据 高 速 缓存 中 不 同 的 到 命中 情况 造成 的 。 


练习 题 9.6 

c 表示 如 果 没 有 高 速 妊 友 不 命中 ， 调 用 proca 或 者 procB ИЮ АЯК. ТАЖ. = 
高 速 缓 存 不 命中 浪费 的 周期 可 以 分 摊 到 每 个 需要 取出 来 放 到 高 速 锭 存 中 的 数据 上 ， 

e 实现 测 醒 代码 的 指令 【例如 start counter. get, counter 等 等 )。 设 这 些 指令 所 需 周 期 数 为 m. 

e ЖУЛИЯ ЕЛЕН ЕАУ ( procA 或 者 procB )， 设 这 些 指 令 所 需 有 周期 数 为 p. 

s 被 更 新 的 数据 位 置 (由 Dl，b2 或 b3 指示 )。 设 这 些 指令 所 需 周 期 数 为 d. 

根据 图 9.13 ӘКЕЛЕ. SR c. m. pied ЕЙ. 





Жш Ww Br ЖЕДЕ. АНЕ B AR. “B — 4 ДЕШЕ?! "жәнЕ, 对 这 个 问题 没 
Hi Bi ЗЕ, АШЕР КЕ ШЕННЕН, DN RI ЕД u SCRI E IR. — + 
问题 是 测量 值 每 次 运行 部 不 相同 。 图 9.13 所 所 的 测量 表 显示 的 只 是 -次 测量 的 数据 , 在 反复 的 测量 
中 ， 我 们 看 到 测量 1 的 范围 为 017 一 606, 而 测量 5 的 范围 为 301 一 326。 另 外 ， 其 他 四 次 测量 每 次 运 
tr PR EUR JU RR. 

EA. ШЕЛІ, HATER Т WWE Sus ЕЛЕ Mom A ЕТЕТІНІН. XE 
步 来 说 ， 它 的 变化 程度 最 容易 大 。 测 量 $ 包括 了 将 procB 加 载 到 高 速 组 存 中 的 开销 。 它 的 变化 程度 
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也 容易 比较 大 。 在 大 多 数 实际 应 用 中 ， 门 样 的 代码 会 被 反复 执行 。 因 此 ， 将 代码 加 载 到 指令 高 速 组 
仓 中 的 时 间 相对 而 言 不 太 重 要 。 我 们 的 示例 测量 有 点 人 为 的 痕迹 ， 内 为 指令 高 速 缓存 不 命中 的 影响 
比 实 际 应 用 中 的 要 大 一 些 。 

为 了 测 电 过 程 P 所 需 的 时 间 ， 侍 过 程 P 中 指令 高 速 缓存 不 命中 的 影响 已经 减 小 到 最 低 了 ， 我 们 
可 以 执行 下 列 代 码 ; 

] double time_P warmi) 

2 { 
3 Fij; /* Warm up the cache */ 
4 start counterí]; 
2 Р(1; 
5 return дег counteri).: 
1 | 


代 井 始 测 量 乙 前 执行 一 次 P， 会 将 了 所 用 的 代码 放 入 到 指令 高 速 缓存 中 。 

这 段 代 公 人 也 使 数据 高 速 缓存 不 命中 的 影响 降低 到 最 小 ， 因 为 第 一 次 执行 P 也 将 P 访问 的 数据 族 
ARRERA T. ГАЙ ргосА 和 proch, time P wam 的 测量 会 得 到 100 个 周期 。 如 果 我 
们 预想 代码 会 重复 地 访问 同样 的 数据 ， 屠 么 这 就 是 测量 的 正确 条 件 。 丰 过 对 于 一 些 应用， 我 们 更 可 
能 古 每 钦 执 行 部 访问 新 的 数据 。 例 如 ， 一 个 过 程 妾 数据 从 存 情 器 的 一 个 区 域 撞 贝 到 另 一 个 区 域 ， 很 
可 能 调用 时 淡 和 块 被 缓存 。 过 程 me P warm 倾向 于 低估 这 样 -个 程序 的 执行 时 间 。 对 于 proca 或 
£ ргосВ, 它 会 得 到 100 个 周期 , 而 不 是 当 过 程 被 应 用 到 本 缓存 的 数据 上 时 测 出 的 132 一 134 个 周期 。 

为 了 使 计时 代码 测量 一 个 初始 时 没有 数据 被 缓存 了 的 过 程 ， 我 们 可 以 在 执行 实际 的 测量 之 前 ， 
清 衬 曲 速 缓存 中 所 有 有 用 前 数据 。 下 而 的 过 程 就 是 为 一 个 沿 速 缓存 大 小 不 大 十 512KB 的 系统 完成 这 
一 屿 能 的 ; 





code/perf/time p.c 
/* Number of bytes in the largest cache to be cleared */ 

define CBYTES 11<<19! 

*define CINTS |CBYTES/sizeof(int)) 


/* А large array to bring into cache */ 
static int dummy [CINTS]: 
volatile int sink: 


С -ісілы». м Із ғ 


9 /* Evict the existing blocks from the data caches */ 
10 void clear cachet) 


11 (4 

12 int 1; 

13 int sum - 0; 

14 

15 tor {1 = Әрі < CINTS; i++) 
16 Jumny[i] = 3; 


17 for {1 = 0; i < CINTS; i++) 
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18 Ша += dummyill; 
19 sink = sum: 
20 +} 


------ — — cadefperjftime p.c 


这 个 过 程 只 是 在 一 个 非常 大 的 数组 dummy 上 执行 一 个 计算 ， 有 效 地 从 高 速 缓存 中 清除 出 所 有 
其 他 的 东西 。 这 个 代码 有 几 个 特殊 的 性 质 ， 用 来 避免 常见 的 错误 。 它 将 值 疗 储 到 dummy P. # B 
把 它们 读 出 来 ， 这 样 无 论 高 速 缓存 分 配 策略 是 怎样 的 ， 都 会 缓存 这 个 数组 。 这 段 代码 用 数组 的 值 执 
行 一 个 计算 ， 并 将 结果 存储 到 一 个 全 局 整数 中 【声明 为 volatile 就 表明 对 这 个 变量 的 任何 更 新 都 必 
须 被 执行 )， 这 栏 丁 得 鼎 明 的 优化 编译 器 不 会 忧 化 掉 这 部 分 代码 。 

使 用 这 个 过 程 ， 我 们 可 以 获得 在 P 的 指令 都 被 缓存 而 数据 没有 被 缓存 的 情况 下 了 的 一 个 测量 
ің: 

1 double time P cold() 

2 Í 

3 Pi): /* Warm up instruction cache */ 

4 clear cache(); /J* Clear data cache */ 

5 start counterí]; 

б Р{); 

7 return get_counterí); 

8 ) 

当然 ， 这 个 方法 也 有 缺点 。 在 一 个 有 统一 L2 高 速 缓存 的 机 器 上 ， 过 程 clear_cache & & X P B$ 
所 有 指令 都 被 清除 。 幸 运 的 是 ，L1 指令 高 速 缓存 中 的 指 今 还 会 保存 ， 过 程 clear cache 还 会 从 高 速 
缓存 中 清除 出 大 部 分 运行 时 栈 ， 导 禾 过 禹 地 估计 了 在 更 加 真实 的 条 件 中 了 所 需要 的 时 入 。 

正如 这 里 的 讨论 说 明 的 那样 ， 亡 速 缓存 的 影响 为 性 能 测量 增 坝 了 特殊 的 困难 。 程 序 员 几 平 不 能 
控制 什么 指令 和 数据 会 被 苏 载 到 高 速 缓存 中 ， 而 当 几 须 加 载 新 值 时 又 该 清除 什么 指令 和 数据 。 最 好 
的 情况 耻 ， 我 们 能 够 设置 好 测量 条 件 ， 通 过 一 些 请 空 和 加 载 高 速 缓存 的 组 合 ， 使 得 测量 条 忻 与 我 们 
ЛУНАН ВЯ AR VU RE 

ЕЕЕ ЗЕ ИЮ, Л В E UU АРЕ RE. НАУАН ААР ЕИ. 
FART EARE NRS. XX HUIUS ГЕ dr EI 2 T9 EDU ТОАТ ИИ 
的 ， 当 系统 从 一 个 进程 切换 到 另 一 个 时 ， 开 始 时 新 进程 中 的 分 支 预测 是 根据 前 一 个 进程 中 执行 的 分 
文 指 令 来 进行 的 。 不 过 ， 实 际 上 ， 这 些 影 响 对 程序 的 每 次 执行 只 会 造成 很 小 的 性 能 变化 。 有 预测 主 要 
依 束 于 最 近 的 分 支 ， 因 此 一 个 进程 对 另 一 个 进程 的 影响 非常 小 。 
943 上 次 最 优 测量 方法 

虽然 我 们 使 用 周期 计时 器 测量 容易 受 由 上 下 文 切 换 、 高 速 组 存 操作 和 分 支 预 测 引 起 的 误差 的 影 
吗 ， 但 是 一 个 重要 的 特性 就 是 这 些 误 差 总 是 导致 过 高 地 估计 真实 的 执行 时 间 。 处 理 器 做 的 事情 都 不 
会 人 为 地 加 速 一 个 程序 的 执行 ， 即 使 上 下 文 切换 和 其 他 影响 会 引起 测量 值 不 一 致 ， 我 们 仍然 可 以 利 
用 这 个 属性 来 狭 得 执行 时 间 可 靠 的 测量 值 。 

假设 我 们 重复 地 执行 一 个 过 程 ， 用 time_P_warm 或 者 time P cold 来 测量 周期 数 。 我 们 记录 K 
(例如 3) 次 最 快 的 时 间 。 如 果 我 们 发 现 这 种 测量 的 误差 < ЕХ Ch 0.1 免 )， 那 么 用 测量 的 最 快 值 


576 TE 


ЖАННАТЫ ШЖ Де Ж. FE ЛЇЇ, BRATE 9.11 所 术 的 那些 次 测量 ， 我 们 
RERAN 1.06. WAAR 1 НЕ А АЕ УАХИ, 而 负载 4 最 快 的 二 个 测量 
信行 这 个 涡 莽 光 围 之 内 。 因 此 我 们 可 以 得 出 结论 说 运行 时 间 分 判 为 35.98 ms 和 35.89 ms. 对 于 负载 
4 的 情况 ， 我 们 还 可 以 看 到 测量 值 集 中 在 125.3 ms 附近 ， 有 六 个 大 约 为 155.8 ms， 但 是 我 们 安全 地 
斑 友 了 这 些 过 高 的 估计 值 。 

我 们 称 这 种 方法 为 “ 民 次 最 忧 【K-Best) 方法 ”"。 它 要 求 设置 二 个 参数 ， 

K: 我 们 要 求 在 茶 个 接近 最 快 值 范围 内 的 测量 值 数 量 ， 

е 这 些 测 量 必 须 有 多 大 程度 的 接近 。 也 就 是 ， 如 果 测 量 值 按照 升序 标号 为 WwW， va v va ' 
АКТГ ЖА + g)v 2 vk. 

М: 在 我 们 中 止 之 前 ， 测 量 什 的 最 人 数量 。 

我 们 的 实现 进行 了 系列 尝试 ,并且 护照 排序 的 方式 维护 着 一 个 个 最 快 时 间 的 数组 。 对 十 每 
个 新 的 测量 值 , pue ix LS EG AE S HAW КӨРДЕН. шж, 它 会 蔡 换 数组 元 素 K, 
然后 执行 一 系列 相 邻 数组 售 置 之 间 的 变换 ， 将 这 个 值 称 芭 数 组 中 适当 的 位 置 。 继 续 这 个 过 程 ， 肯 到 
ЛИЧ дЕ, ВВТ ЧЕ с И Г", НАВИТ ЯЕ M， 此 时 我 们 称 测 量 值 不 
能 收效 。 

试验 评价 

我 们 进行 了 系列 试验 来 测 景 K 次 最 优 测量 方法 的 准确 性 。 上 下 商 是 … 些 我 们 和 起 于 解决 的 问 
ЯЙ. 

|l. АРЕНЕ ЕНЕ ВИ аа? 

2. ТАРЕ МЕЧЕ C, ШЕНІ 6 Е? 

3. iX AT ЕЛГЕН CLR E ЕЕ? 

没 计 这 样 的 试验 的 一 个 挑战 是 要 知道 我 们 正在 试图 测量 的 程序 的 实际 适 行 时 间 。 只 有 这 样 ， 我 
们 才能 确定 我 们 测量 的 准 克 性 。 我 们 知道 ， 只 要 我 们 正在 测量 的 计算 不 被 中 断 ， 我 们 的 周期 计时 器 
就 能 够 给 出 准确 的 结 虹 。 对 于 比 计数 器 间隔 “ 短 很 多 的 计算 ， 运 行 在 负载 很 轻 的 机 器 上 时 ， 被 中 断 
的 可 能 性 很 小 ， 我 们 利用 这 些 属性 来 获得 对 真实 运行 时 间 的 可 靠 估 计 值 ， 

根据 我 们 的 测量 日 奈 ， 我 们 使 用 了 一 个 过 程 ， 它 反复 地 往 个 2048 个 整数 的 数组 中 写 值 ， 然 后 
骨 读 出 来 ， 类 似 于 clear cache 的 代码 。 通 过 设置 重复 的 次 数 r， 我 们 可 以 创建 需要 一 定时 间 的 计 条 。 
生 先 ， 我 们 设 这 个 过 程 期 望 的 运行 时 间 为 上 的 一 个 函数 ， 用 TD 来 表示 ，r 从 1 变 到 10， 对 运行 时 
团 计 时 《得 到 的 时 间 为 009 一 09ms)， 执 行 最 小 二 乘 方 拟 侣 ， 找 到 形 如 TIm = mr +b 的 公式 ， 通 过 
ЕЛІ ЖЕНЕ. М Ат 的 值 执行 100 次 测量 ， 井 且 在 一 个 负载 很 轻 的 系统 上 运行 测量 ， 我 们 - 
SS D ERNER ТОННА. ET Ig ER ЖЕЛ БІН Аз Tr) = 49273.41 + 166 (单位 为 时 
PRESE) 拟 合 这 些 数据 ， 最 大 误差 小 于 0.049. RARE ЕЕ ИН ННІ B SIE 
НЕН, ix MIS XE v — АЖ. 

RE RIA К БИТЕ ШАТ ВЕ, 20 К 23. e = 0.001, 而 M = 30. RAS г 
ТААТ Н. Sefg n o T I [8] ШЖ 0.27 50те. У FEES Шан Мг), БІН 
E = (MI - Т(т))/Т(т) ЖТ Pr IERE EnD. BÉ 9.14 展示 了 在 一 个 Intel Pentium Ш 上 运行 Linux 
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的 系统 中 ， 对 玫 次 最 优 方法 的 一 个 试验 验证 ， 在 这 张 图 中 ， 我 们 给 出 了 作为 TD 的 一 个 函数 的 测量 
误 基 Eu， 这 里 我 们 给 出 的 TI 的 单位 为 ms。 注意， 我 们 是 以 对 数 只 度 来 显 人 了 的 :每 条 水 平 
线 代 去 测量 误差 的 一 个 数量 级 ， 为 了 使 准确 率 在 1 名 之 内 ， 我 们 必须 让 误差 在 0.01 以 下 。 我 们 不 试 
Hd йк ТЕЙ F 0.001 (5882 0.1%) 的 误差 ， 因 为 我 们 的 测试 环境 不 提供 这 各 高 的 精度 。 


Intel Pentium ІП, Linux 
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914 下 次 最 优 测量 方法 在 Linux 系统 上 的 验证 
当 执行 时 间 最 高 为 8ms 时 ， 我 们 НИЕНІ ЕЕ НЕҢ (误差 大 约 在 0196). ТЫРА, ЕЛЕНЕ. 
我 们 过 到 的 系统 过 请 估计 太 约 是 4 名 一 6 可， 而 在 负载 比较 鲁 的 机 器 上， 结果 就 更 差 。 


这 二 组 数据 表明 的 是 在 二 种 不 同和 灸 载 情 况 下 的 误差 。 我 们 看 人 到， 在 所 有 三 种 情况 中 ， 运 行 时 
同 小 于 大 约 7.5 ms 的 测量 都 非常 准确 . 因此 ， 我 们 的 方法 可 以 用 来 在 负载 很 重 的 机 器 上 测量 相对 
比较 短 的 执行 时 间 。* 负 载 1” 那 组 数据 表明 的 是 只 有 一 个 活动 进程 的 情况 。 对 于 大 于 10ms 的 执 
ITERE, MEE T, 全 都 会 过 高 估计 计算 时 间 Т, 大 约 4 更 ~6%。 过 高 估计 是 因为 花 了 时 间 来 处 理 
叶 时 器 中 断 。 这 些 数 据 与 图 9.3 ЖШ trace 一 致 ， 这 个 trace ЖЕҢИШ EE. : 台 负 载 很 轻 的 机 器 
上 ， 一 个 应 用 程序 也 只 能 执行 95%-9 КІН. ^ $43 2" RI “Аба” ЛИН ЕЛІНЕН 
有 其 他 进程 在 执行 时 的 性 能 。 在 这 两 种 情况 中 , 对 于 超过 太 约 7 ms 的 执行 时 间 测 量 值 不 淮 确 得 高 
iB. 注意， 误差 1.0 就 意味 着 T, 是 T. 的 两 倍 ， 而 误差 10.0 就 意味 着 T, E Т, 1 e WHR, 
澡 作 系统 调度 每 个 活动 进程 一 个 计时 器 间隔 C58 n 个 活动 进程 时 ， 每 个 进程 只 获得 Па 的 处 理 
器 时 间 。 

根据 这 些 结果 ， 我 们 可 以 得 出 结论 说 ， 收 次 最 优 方 法 提供 了 对 非常 短 时 间 计 算 的 准确 结果 。 对 
于 测量 超过 大 约 7 ms 的 执行 时 间 ， 这 种 方法 真 的 不 够 好 ， 特 别 是 还 有 其 他 活动 进程 时 。 

不 闺 的 是 ， 我 们 发 现 我 们 的 测量 程序 不 能 可 靠 地 确定 它 是 否 获得 了 准确 的 测量 值 。 我 们 的 测 最 
过 程 计算 它 的 误差 为 Bt = (w - vi， 这 里 轴 是 第 于 个 最 小 的 吊 量 值 。 也 就 是 ， 它 计算 的 是 这 个 


7 58 time interval， 而 我 们 认为 是 timer interval. 
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过 程 刘 达 我 们 收 熏 标准 的 程度 如 何 。 我 们 发 现 这 些 估 计 值 过 于 乐 疯 了 。 即 使 是 对 于 负载 11 的 情况 ， 
测量 值 的 偏 移 达 到 了 10 倍 ， 程 序 却 一 直 估 计 怎 的 误差 小 于 0.001. 

设置 K бА 

在 我 们 前 面 的 试验 中 ， 我 们 任意 选择 参数 КІМНІҢ А3, ПАТЕЖЕТШЕГУЯ, ERNEA 
量 结 果 中 至 少 有 3 次 的 测量 值 相 比 于 最 快 测量 值 间 的 误 姜 在 一 个 指定 因子 内 : 为 了 更 仔 纲 地 衡量 这 
个 因素 的 影响 ， 我 们 使 玉 的 值 从 1 变化 到 35， 并 进行 了 一 组 测量 ， 如 图 9.15 Bros. RA TETTE M 
= ТЕПЕ 9 ms， 内 为 这 是 我 们 的 方法 能 够 多 得 有 用 结 未 的 时 间 上 限 ， 
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4945 КАЙ ЛАН KENAR 
ЖЕНЕН. K 必须 至 少 为 2。 当 程序 时 间接 近 于 计时 器 间隔 时 ， 丰 负载 很 重 的 系统 上 ， 大 于 2 的 值 会 有 帮助 一 些 。 
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E915 k 次 惠 优 方法 中 不 同 K 值 的 效果 OO 
= K = 1 时 ， 在 进行 一 次 测量 后 ， 过 程 就 返回 .这 样 得 到 的 结果 非常 不 规律 ， 等 别 是 当 机 器 负 
载 很 重 的 时 候 。 如 果 刚 好 发 生 了 计时 器 中 断 ， 结 果 就 更 不 准确 了 。 即 使 没有 发 生 这 样 的 灾难 ， 测 量 
值 也 容易 受 很 多 因素 的 影响 ， 变 得 不 准确 。 将 K 设置 为 2 就 极 大 地 改善 了 准确 性 ， 对 于 小 于 Sms 
的 执行 时 间 ， 我 们 得 到 的 准确 人 性 都 大 于 0.19. KOREA, ERN SCEREBPESUGRET. ESI 
大 约 Bms 的 上 限 。 这 些 试验 表明 我 们 最 初 猜想 的 民 =3 是 个 合理 的 选择 。 
AS IHE h COSE RR 
КЕБЕ ЖЕ Ren] PRG НТ, ЕУ RE ТН ІІ КЕ 7 ms 的 测量 中 , SERE SUPER 
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TB KT АЙНА. ШЫЛ Е ЕМ ЗА ETT ET —T1 X RW E HM ЕНЕН S fe 
МЕ, ЮЛ ВЕДА Н. А EPETAX. 

1. 我 们 必须 确定 人 处理 ТИШЕ ТЕ Ж ЕЛЕН» 73 Т RF RI A ATCP ВЕНУ EN- - 
mU, RIE ЕЕ ЯНИ — УИ ЛИГ ЕНЕЛЕР ЫЙА. ҚЫН» ИП КА ЕМЕ. 

2, EE He ЛИЙ E TE 4E UE E КЕ] ЇН] РЧ АТЫ ӘНІН. 

Te Hia DU E 9.3 和 图 9.5 PAR trace 的 方法 ， 我 们 可 以 发 现 不 活动 的 时 间 段 ， 开 确定 尼 
TIETE a 这些 不 活动 时 间 段 ， 有 些 是 由 计时 器 中 断 造 成 的 ， 有 坚 是 由 其 他 系 统 事件 造成 的 。 
我 们 果 以 确定 使 用 times МЕНЕЕ АНЫН, ІҢ ИННА АСЕР РЕЗ, ЖАНИЯ 
增加 一 个 滴答 。 我 们 大 100 个 不 活动 周期 进行 这 样 一 个 评估 ， 发 现 最 小 的 计时 器 中 断 椒 理 时 间 段 入 
251 466 个 周期 ， 为 了 确定 我 们 正在 测量 的 程序 执行 期 间 发 生 的 计时 器 中 断 识 数 ， 我 们 简单 地 调 
用 umes ANNI ЕНЕР BU. EFR. Buite. 

id 9.16 Hos АЯМА ИІР НОРМЕ. WERE. МОЛЛА EIUS L, 
RH go DTE # МН ЕМЕ, EAT RE CLE SUE TEES Ce 1.009 2 8) ІШІН Г Ж ШЕ 
И Же, MERITAT ЛАЕШ НЕ ЙЕ УЫ. 5- 方面， 我 们 可 以 在 到 这 种 
МЕХНАТ 8 ARENIS КЕ РЕЗИ ШЕ. 
intel Pentium III, Linux 
КЕРН EE TES 
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6 918 衬 售 计 时 器 中 断 开 销 的 测量 
这 种 方法 极地 提高 了 在 负载 很 杷 匆 机 器 上 .持续 时 间 较 长 的 制 电 的 准确 性 。 
在 其 他 机 器 上 的 评 村 
因为 我 们 的 方法 极 人 地 依赖 于 操作 系统 的 调度 策 覆 ， 所 以 我 们 还 在 其 化 二 种 系统 配置 上 进行 了 
试验 : 


l. 运行 Linux AHR EIA (20.36 和 2.2.16) 的 Intel Pentium I. 
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2. 运行 Windows-NT 的 Intel Pentium Ш. КТАН Ау AI 处 理 器 ， 但 是 这 趟 操作 
系统 与 Linux 完全 不 同 。 

3. 1517 Tru64 Unix 的 Compaq 和 ipha。 它 使 用 的 是 一 个 非常 不 同 的 处 理 器 ， 但 是 操作 系统 类 个 
T Linux. 

如 图 9.17 Bron, EREEREER Linux. КЕНЕН ЖЕ. СЕВ ЈА Lo A FILE 
任意 持续 时 间 的 程序 ， 测 量 香 的 准确 性 部 在 0.2 免 以内。 我 们 发 现 ， 使 用 这 个 版 本 的 Linux, ЖЕЛЕ 
处 理 一 个 计时 器 中 断 只 花费 了 大 约 3 500 个 周期 ， 即 司 是 在 负载 很 重 的 机 器 上 ， 它 允许 进 程 一 次 最 
多 运行 大 约 180ms 。 这 个 试验 表 硼 操作 系统 的 内 部 细节 会 极 大 地 影响 系统 性 能 和 我 们 效 得 准确 测量 
值 的 能 为 。 


jate Рентішіт Ш, Linux 
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89.7. 上 次 最 优 测 量 方法 谋 使 用 较 老 内 核 版 本 的 1A32/Lnux 系统 上 的 试验 验证 
在 这 个 系统 上 ， 即 使 呈 对 有 较 长 执行 时 间 的 要 序 ， 特 划 是 在 负载 很 轻 的 机 器 上 ， 我 们 也 能 获得 更 准确 的 测量 什 。 


图 9.18 Жол T E Windows-NT 系统 上 的 结 泉 。 总 地 来 说 ， 这 些 结 果 类 似 于 那些 较 老 Linux 系统 的 
售 果 。 对 于 短 时 间 航 计算 ， 或 者 在 负载 很 轻 的 机 器 上 ， 我 们 可 以 获得 准确 的 测量 值 。 在 这 种 情况 中 ， 
我 们 的 准确 度 是 大 约 0.01 (也 就 是 1.0%), 而 不 是 0.001. 不 过 , 对 于 大 多 数 应 用 来 说 ,这 就 足够 好 了 。 
另外 ， 在 负载 很 重 的 机 器 上 ， 我 们 可 靠 的 和 不 可 靠 的 测量 值 之 问 的 门限 值 大 约 是 48ms。 一 个 有 趣 的 
特性 是 ， 有 时 候 在 负载 很 重 的 机 器 上 ， 即 使 是 对 最 长 245 ms 的 计算 ， 我 们 也 能 够 获得 准确 的 测量 值 。 
VES, NT 的 调度 器 有 时 候 会 允许 进程 保持 活动 较 长 的 一 段 时 间 ， 但 是 我 们 不 能 依靠 这 个 属性 。 

Compaq Alpha 的 结果 如 图 9.19 所 示 。 我 们 再 次 发 丽 ， 在 负载 很 轻 的 机 器 上 ， 几 平 任意 持续 时 
间 的 程序 浏 其 出 来 的 误差 都 小 于 1.0%。 在 负载 很 重 的 机 器 上 ， 只 有 持续 时 间 小 于 大 的 10ms 的 程序 
才能 被 准确 测量 ， 
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19.18 长 次 最 优 测量 方法 在 WindowsNT 系统 上 的 试验 验证 


ET SE EBSL. ВИ ВЕНН ИТАН Е ÆA LOO. АВЕ E. ТНК АТ 48ms 的 
МН, МАТЕ ЧУЕ А. 
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4 919 КЕНЖЕ Сотраа Alpha 系统 上 的 试验 验证 


УУЛКАН ЖЕ, ПЕН Оле < 10%) НА. XET GRE EAE. KT LOms 的 持续 时 间 就 不 能 
EAHA T. 


Ж 9.7 
假设 我 们 希望 测量 一 个 需要 tms 的 过 程 。 机 器 的 负载 很 重 ， 因 此 不 多 许 我 们 的 测量 进程 一 次 运 
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行 超过 50ms. 

А. 每 次 试验 都 血 揪 测 量 这 个 过程 的 一 次 执行 , 息 诈 一 次 试验 从 Sins 时 间 段 中 某 小 任意 时 间 点 
开始 ， 思 许 这 次 试验 过 行 完成 而 不 会 被 交换 出 来 的 概率 是 多 少 ? 将 你 的 答 业 表示 成 t 的 一 个 函 教 ， 
考虑 所 有 可 能 的 t 的 傅 . 

B. ATRA pi Kalt tik MATERNE (baka. 那些 在 一 个 时 间 段 之 内 完成 的 运行 )， 
预期 所 需 的 测 重 次 数 是 多 少 ? 将 你 的 答 娄 表示 威 1 的 一 个 函 教 ， 体 预测 t= 20 和 t= 40 时 这 些 秆 应 该 
E $ y? 

ак 

这 些 试 验证 明 导 次 最 优 测 量 方法 在 多 种 机 器 上 都 工作 得 相当 好 。 对 于 负载 很 轻 的 处 理 器 ， 在 大 
多 数 机 器 上 ， 即 使 是 对 长 持续 时 间 的 计算 ， 它 总 是 能 得 到 准确 的 结果 ， 只 有 斌 新 版 本 的 Linux 会 导 
臻 非常 高 的 计时 器 中 岂 开 销 ， 严 重 影 响 测 量 的 准确 性 。 对 于 这 个 系 统 ， 补 偿 这 种 开销 会 极 大 地 提高 
West. 

在 负载 很 重 的 机 器 上 ， 当 执行 时 间 变 得 比较 长 时 ， 获 得 准确 的 测量 值 变 得 很 困难 。 大 多 数 系 统 
部 有 某 个 最 太 执 行 时 间 ， 当 最 大 执行 时 间 超 出 了 测量 界限 ， 那 么 准确 度 会 变 得 非常 糟 烽 ， 这 个 门限 
值 高 度 依赖 于 系统 ， 但 是 通常 是 在 10—200ms 之 间 ， 


95 基于 gettimeofday 函数 的 测量 


我 们 对 IA32 周期 计 装 器 的 使 用 提供 了 高 精度 计时 测量 ， 但 是 它 有 个 缺陷 ， 那 就 是 只 能 工作 在 
IA32 系统 上 。 最 好 是 有 一 个 可 移植 性 更 好 多 解决 方法 。 我 们 看 到 库 图 数 times 和 clock ERER 
数 器 来 实现 的 ， 因 此 不 是 十 分 准确 ， 

ЖТИ ЕЛДЕН ЕЖ gettimeofday。 这 个 函数 查询 系统 时 钟 【system clock) 以 确定 当前 
的 日 期 和 时 间 ， 


#include "time.h" 


struct timeval í 
long tv_sec; /* Seconds */ 
long tv usec: /* Microseconds */ 


} 


int gettimeofday(struct timeval *tv, NULL): 





йй. E AIRES 0. XB, 


ЗВТ НАН- IHRER EX ED B Mgr, xx MEE ELS — 1 s 的 字段 ， 还 
有 一 个 单位 为 hs 的 字段 。 第 一 个 字段 存放 的 是 自从 1970 年 1 月 1 日 以 来 经 过 的 总 秒 数 【对 于 所 有 
的 Unix 系统 来 说 , 这 都 是 一 个 标准 的 大 考点}。 注意 , 在 Linux 系统 上 ，gettimeofday МЖС РЕК, 
应 该 简单 地 置 为 NULL， 因 为 它 指向 一 个 未 被 实现 的 执行 对 区 校正 的 特性 。 


> 9.8 | | Us 
在 一 个 32 位 机 器 上 ，、 到 什么 日 期 gettimeofday 写 入 到 tv. sec FRASA fd? 
如 图 9.20 所 示 ， 我 们 可 以 用 gettimeofday 来 创建 两 个 计时 器 函数 start_timer 和 get_timer， 它 们 
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类 羽 于 我 们 的 扇 期 计时 通 数 ， 除 了 和 天 们 的 测量 时 间 是 忌 秒 为 单位， 而 不 是 户 时 钟 周期 为 单位 的 。 


code/perf/tod. c 
1 Әіпсішде «sys/.lme.h- 
2 Hinclude <unisrcda,h> 
3 
4 static struct Limeval tas-art; 
8 
6 /* Record current time */ 
7 void sLarL timer(; 
8 { 
9 getLimeofday (&tstart, NULL); 
10 | 
11 
12 /* Get number of seconds since last call to start, timer */ 
13 double get timeri) 
14 
15 struct timeval tfinish; 
16 long sec, usec; 
l1" 
18 gettimeofdayt&t£inish, NULL); 
19 чес = tfinish.tv sec - tstart.tv sec; 
20 usec = tfinish,tv vusec - tstart.tv usec; 
21 return sec + le-6*usec; 
22 | 
code/perf/tod.c 


9.20 ”使 用 Unix gettimeofday 的 计时 过 程 
AX PEUT EE UET RE. IR RUE ИНЕК Fi Bb E SIF] ЕЛІ. 


JR VERE HUU ИК F gettimeofday 是 如 何 实现 的 ,而 gettimeofday BJ 3: E. BE 3& AE Л Ja] o A 
Is. ERKA Ар 为 单位 的 测量 值 看 上 去 非常 好 ， 但 是 事实 证 明 测 量 值 并 不 总 是 那么 
准确 .图 9.21 展示 了 在 几 个 不 同 的 系统 上 测量 这 个 函数 的 结果 ,我 们 定义 阴 数 的 分 状 度 (Tesojution ) 
为 片 时 右 可 以 分 辩 的 最 小 时 间 值 。 我 们 通过 反复 调用 gettimeofday 直到 写 到 第 一 个 参数 的 值 改变 
了 ， 来 计算 这 个 值 。 那 么 ， 分 状 度 就 是 它 改 变 了 的 ps 数 。 正 如 这 张 才 所 兴 ， 有 些 实现 实际 上 可 以 
分 辨 hs 级 的 时 间 ， 而 另 一 些 就 没 那么 精确 了 。 有 这 样 一 些 差别 ， 是 因为 有 些 系统 用 周期 计数 器 来 
尖 开 这 个 静 数 ， 而 其 他 系统 是 用 间隔 计数 的 。 在 前 者 尿 种 情况 中 ， 分 辨 度 可 以 非常 高 一 一 潜在 地 
mW T Chi K Ed Ims 的 分 辨 度 。 在 后 面 那 种 情况 中 ， 分 辨 度 会 很 糟糕 一 一 儿 乎 和 函数 times 
ЖІ clock 提供 的 相当 。 


图 9.21 还 展示 了 在 各 种 系统 上 调用 ве timer 所 需 的 执行 时 间 Clatency)。 这 个 属性 表明 了 调用 
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这 个 函数 所 需 鉴 的 最 小 时 间 ， 我 们 通过 反复 调用 这 个 丽 数 直到 经 过 了 15, ЕНІ АЛЫН ТАЖ. 
来 计算 这 个 值 。 正 如 看 到 的 那样 ， 在 大 多 数 系 统 上 ， 这 个 函数 调用 需要 大 约 Ims， 而 在 其 他 系统 十 
需要 几 个 ms。 相 比 之 下 ， 我 们 的 过 程 pet counter 每 次 调用 内 需要 大 约 0.2ms。 一 般 而 言 ， 系 统 调 用 
比 蔡 通 的 函数 调用 需要 更 多 的 开销 。 这 个 执 行 时 间 还 限制 了 我 们 测量 的 精确 度 。 邯 使 数据 结构 多 许 
以 更 高 分 辨 度 的 单位 来 表达 时 间 ， 但 是 当 每 次 测量 引起 这 么 长 时 间 的 延迟 时 ， 我 们 还 是 不 清楚 能 够 
多 人 么 准确 地 测量 时 间 ， 


Pentium ПП, Windows-NT 10 000 5.4 
Pentium ІП Linux 1 0.9 
图 9.21 gettimeofday 实现 的 特性 


开 些 实 殉 使 用 的 是 间隔 计 靳 ， 而 其 他 的 合用 的 是 周期 让 时 器 。 这 棚 大 地 影响 聘 量 的 精确 性 。 
HH 9.22 展示 了 我 们 从 一 个 使 用 gettimeofday ri^ ДЕ ЖИП 8 СЛ eR ЖЛ fu] КУАДЫ Sr as S K IX 


(ЕЙ gettimeofday 
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Ж 9,22 ЗЕҢ сейтеосау 08 К 次 最 优 测量 方法 的 试验 验证 
Linux 是 用 周 其 计数 器 来 实现 这 个 霄 数 的 ， 所 以 精确 度 与 我 们 的 计时 例 程 一 样 。Windows-NT ШЕШ И ЖЖБИ H, 
因此 精确 度 狠 低 ， 特 别 是 对 于 短 的 持续 时 间 来 说 。 
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E {АЛИШ ЛЫН АН ІН ЕНЕ. RIR ИМЕК АЛЫН І НЕЕ, LOAA E T] AERE ES 
确 性 的 影响 。 在 Windows-NT Ж LANE AHRR UTRINE Linux 系统 上 使 用 times 
时 发 现 的 特性 《图 9.8). АХ gettimeofday 是 用 进程 计时 器 来 实现 的 ， 所 以 误差 J 能 是 负 的 ,也 
可 能 十 正 的 ， 对 于 扼 持 续 时 间 的 测量 ， 克 其 不 规律 。 对 于 较 长 的 持续 时 间 ， 准 确 性 有 所 改进 ， 直 
到 对 于 超过 200ms 的 持续 时 和 疗 误 差 小 于 2.096 RE. Æ Linux 系统 上 测量 值 络 出 的 结果 类 似 于 直接 使 
用 周期 计数 器 时 得 到 的 结 沫 ,通过 比较 图 9.14 中 负载 工 结果 的 测量 值 (没有 进行 补偿 ) 和 图 9.16 
НЕЕ ЯН 进行 了 补 楼 )， 可 以 看 出 这 一 点 。 使 用 了 补偿 ， 即 使 是 对 长 达 300ms 的 测量 ， 

我 们 也 可 以 获得 好 于 0.04 免 的 准确 度 。 因 此 ，gettimeofday 与 直接 沪 问 这 台 机 器 上 的 周期 计数 器 完 
成 得 一 样 好 ， 


96 Zg&: 一 个 实验 协议 


我 们 可 以 以 协议 的 形式 总 结 -上 我 们 的 试验 发 现 ， 来 确定 如 何 回 答 这 个 问题 ,“ 称 序 X 在 机 器 
Y 上 运行 得 有 多 快 ? ” 

* ШЖХ ARRESTERE (例如 ， 大 于 10s)， 那 么 间隔 计数 应 该 就 工作 得 足够 好 了 上 ， 而 
НА А А АЖ. 

• ШАХ 预期 的 运行 时 间 在 范围 人 人 约 0.01 一 10s 之 间 ， 那 么 在 负载 很 轻 的 系统 上 ， 使 用 准确 
的 、 基 于 周期 的 计时 来 进行 测量 就 很 重 归 了、 我 们 应 该 执行 gettimeofday PE 038 ЕН, 
来 确定 它 在 机 器 Y 上 的 实现 是 基于 周期 的 ， 还 是 基于 间隔 的 ， 

* 如 果 消 数 是 基 十 周期 的 ， 那 么 用 它 作为 K 次 最 优 计 时 函 数 的 基础 。 
е 如 未明 数 是 基于 间 陋 的， 那么 我 们 必须 找到 一 些 使 用 机 器 的 周期 计数 器 的 方法 。 这 可 
会 而 旧 汇编 语言 编码 。 

• ШЖХ ИЙ ШЕТИН ЛЕ KZ) 0015, 那么 只 要 使 用 的 是 基于 周期 的 计时 ， 纯 使 是 在 抽 裁 
很 里 的 机 如 上 ， 也 可 以 完成 精确 的 测量 。 姥 么 ， 我 们 着 丰 用 gettimeofday 或 直接 访问 机 器 
ЖЖС, ЖЕН -个 天 次 最 忧 计时 函数 。 


97 展望 未 来 


系统 中 引入 了 几 个 对 性 能 测量 有 很 大 影响 的 特性 ; 

e 与 过程 相关 的 周期 计时 。 对 于 操作 系统 来 说 ， 管 理 周期 计数 器 相对 比较 窜 易 ， 所 以 它 指明 
了 茶 个 进程 经 过 的 周期 数 。 那 么 ， 当 进程 重新 变 为 活动 时 ， 周 期 计数 器 被 设置 为 当 进程 上 
ЖАНА) (deactivated) 时 它 的 值 ， 在 进程 不 活动 时 有 效 地 冻结 卫 计数器。 当然， 计数器 还 
是 会 受 髓 核 操作 并 销 和 高 速 缓存 的 影响 的 ， 人 得 是 至 少 其 他 进程 的 影响 不 会 很 严重 。 已 经 有 
一 些 系统 支持 这 个 特性 了。 根据 我 们 的 协议 ， 这 允许 我 们 使 用 基于 周期 的 计时 来 获得 类 于 
KE 0.015 持续 时 间 的 准确 测量 值 ， 郧 使 是 在 负载 很 重 的 机 器 上 。 

› 烽 率 变化 的 时 钟 。 为 了 降低 功 耗 ， 未 来 的 系统 会 改变 时 钟 频率 ， 因 为 功 耗 睛 接 与 时 钟 频 
率 相关 。 在 那 种 情况 中 ， 我 们 不 会 有 时 钟 周期 与 ns 之 间 的 … 个 简单 的 转换 。 甚 至 于 很 
难 知 道 应 该 用 吐 个 单位 来 表达 程序 性 能 。 对 于 代码 优化 器 ， 通 过 计算 周期 ， 我 们 能 线 得 
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更 多 的 了 解 ， 但 是 对 于 实现 带 实时 性 能 限制 的 应 用 的 人 来 说 ,实际 运行 时 间 会 更 重奖 一 
此 


— 
— 


98 ”现实 生活 : K 次 最 优 测量 方法 
EAZ -TERAN eye "ERI K 次 最 优 方 法 来 测量 明 数 了 所 需 归 的 时 特 周 期 数 ， 


#include "'c.ock.h" 


#include "Ісус.һ” 


сүрейет void (*rtest funct)lint %); 


double fcycibest funct f, int *paramg]; 


ЖШ: iÉ A params dd f HEU S ЖЖ. 





参数 params 是 一 个 指向 整 数 的 指针 。-- 般 而 言 ， 它 可 以 指向 一 个 整数 数组 ， 这 个 数组 是 被 测量 
Ey A. Жш, ЗАЛАА ЛЕЙ lower 和 lpwer2 时 ， 我 们 传递 一 个 指向 一 个 int 的 指 
针 作 为 参数 ， 它 是 要 转换 的 字符 串 的 长 度 ， 在 产生 存储 器 出 【第 6 章 ) 时 ， 我 们 可 能 费 传 递 一 个 指 
问 大 小 为 2 的 数组 的 报 针 ， 其 中 包括 类 小 条 步 长 。 

有 很 多 控制 测量 的 参数 ， ИШК, к 和 NM 的 值 ， 以 及 在 每 次 测量 之 前 是 否 要 清除 高 速 钥 存 。 可 
以 用 则 样 在 这 个 库 中 的 范 数 来 设置 这 些 参数 《详情 请 参见 文件 feyc.h)。 


99 得 到 的 经 验 教 训 


通过 设计 一 种 蕉 确 计 时 方法 ， 以 及 在 许多 不 同 的 系统 上 评价 这 种 方法 的 性 能 的 努力 ， 我 们 学 到 
І EBEN. 

. £ A KARA КА. RFE ЭМРАӘЯНЕ ИЗЕН ЫА RT UL ШЇ ОЙЛЫ ЛЕШ Ж 
TB SER n PA ФАБ R ЈН. 

° 试验 可 以 是 非常 有 启迪 性 的 。 通过 运行 简单 试验 以 产生 活动 trace 的 方法 ， 我 们 获得 了 对 操 
作 系统 调度 程序 的 深入 了 解 。 这 产生 了 补偿 方法 ， 它 极 大 地 提高 了 在 负载 很 轻 的 Linux Ж 
统 上 的 准确 性 。 一 个 系统 与 另 一 个 系统 是 不 同 的 ， 即 使 是 一 个 OS 内 核 也 与 下 - -个 版 本 的 
人 不同， 能 够 分 析 和 理解 影 啊 一 个 系统 性 能 的 各 个 方面 是 很 重要 的 。 

° 在 负载 很 重 的 系统 上 获得 准确 的 计 对 特别 图 难 。 大 多数 系统 研究 者 在 专门 的 基准 系统 上 进 
行 他 们 所 有 的 测量 。 邮 们 常常 关 掉 系统 的 许多 OS 和 网 络 特性 ， 以 减少 会 引起 不 可 预测 活 
动 的 因素 。 不 裕 的 是 ， 交 通 的 程序 员 没有 这 么 奢 修 。 怕 们 必须 与 其 他 用 户 共享 系统 。 即 使 
症 在 负载 很 重 的 系统 上 上， 我 们 的 K 次 最 优 方 法 对 于 测量 短 于 计时 器 间 踢 的 持续 时 间 来 说 ， 
tu RR 2488419. 


e 试验 建立 必须 控制 一 些 造成 性 能 变化 的 因素 。 高 速 缓存 能 够 极 大 地 影响 一 个 程序 的 执行 时 
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间 。 传 统 的 技术 是 在 计 时 开始 之 前 ， 清 空 晶 速 组 在 中 的 所 有 有 用 的 数据 ， 虑 是 在 开始 时 ， 
Е. А Т НОРТ Е ЯВА ЭК. 


9.10 Л 


AARET УАН: ЕХ ТЕН Y аен? ”不单 的 是 ， 计 
ЭК) 217 £ ОЕ Е ЕНЕНЕ RE R] SER YER. KATEA 
ААН НЕТА P ТОТ. ИОА ERIE ATTE ЕДІ ns 来 衡量 的 ， 在 宏 疯 级 别 L. 
їй АЛИН ЕН. Е ДЕДА де А ms WE О, ИА ОЦ ЛИ Hh K TER UTE 8909 AEA 
ЖААТ Ет. RITET ms. 

ПЯТРУ 2 j [ЕЧ и АВС АУУБ. АО Е. ТРЕТА Ч ЁТ (timer 
interrupt) AE B5 303642 F 84k, I E УЕЛА P8 ERU HIRE ШЕН EL Cinterval counting}, 
ЖАНЕ ЗЕ МН hihi ЇН] АЕ НЮ EE REEL. XX ROTE Rp КЕННІҢ (至 少 1s) ВЕ 
HH. MI 098 (cycle counter) ЛҒ, ПАНФИКЯЛД АН ЛЕНТАНЫ. ET I rs] 
МІНЕЗГЕ, D RO UHR IRE HESS 导致 很 小 (在 负载 很 轻 的 系统 上 ) 到 很 大 《在 负载 很 
重 的 系统 上 ) 的 误差 ， 因 此， 没有 方法 是 完美 的 。 理 解 在 - -个 特殊 的 系统 上 能 够 获得 的 准确 鼎 是 
很 重要 的 。 

取决 于 表面 存储 器 引用 和 条件 分 支 的 历史 ， 高 速 缓存 和 分 支 预 测 的 影响 可 以 导致 执行 代 但 
E) ACA А БЕЙТ WJ IJ aj К А АУЫ]. 通过 事先 运行 某 些 将 高 速 媛 存 设 置 为 可 了 预测 状态 的 代码 ， 
拒 们 可 以 部 分 地 控制 引起 这 种 变化 的 因素 ,但 是 在 有 上 下 立 切 换 发 生 时 ， 这些 尝试 就 没有 用 了 。 
因此 ， 我 们 必须 进行 多 次 测量 ， 分 析 结 果 ， 以 确定 真实 的 执行 时 间 ， 幸 运 前 是 ， 所 有 引起 变化 
的 因素 的 效果 都 足 增 加 执 行 时 间 ， 因 此 只 需 分 析 确 定 测 出 的 时 间 的 最 小 值 是 否 是 一 个 准确 的 测 
其 值 。 | 

Ж ЖУА, RIER ЕИ Л НЕК DIEI hik, ЖИНАП ЕТЕ, HB BJ 
hi UE] K TB ИЖ B ШЖ ИНГ Г. d Ie Е, ПЕНЕН ЛЕК Ж ЖИЕН 
ін). (EX “АЯ, МІРЯОЫН BIC K D; ЈА АДИЙ. 
$575 YT ИНА 

RTE О К Н Р. Stevens 的 Unix 编程 著作 [81] 记 录 了 程序 计时 的 所 有 各 种 库 立 
Ж. Wadleigh 和 Crawford 的 基于 软件 优化 的 著作 [85] 描 述 了 民 码 剖析 和 标准 计 肝 消 数 ， 

家 庭 作业 

99 %% 

根据 图 9.3 所 示 trace 问答 下 列 问题 。 我 们 的 程序 估计 上 时钟 频率 为 549.9MHz. Ял. 1B 3] 
期 计数 但 来 计算 trace 中 的 毫秒 计时 值 。 也 就 是 说 ， 对 于 一 个 以 周期 来 表示 的 时 间 с, ЖР 
落 夺 时 仁 为 [549900。 不 幸 的 是 ， 程序 估计 时 钟 频率 的 方法 不 完善 ， 因 此 有 些 毫 秘 计时 值 不 太 准 
确 ， 

.这 个 机 器 的 计时 器 辣 隔 为 Oms。 这 些 时 间 段 中 的 哪些 是 由 计时 器 中 断 发 起 的 ? 

В. 根据 这 个 trace， 操 作 系 统 服 务 - -个 计时 器 中 断 所 需 的 最 小 时 钟 周期 数 是 多 少 ? 
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C. 根据 这 些 trace HUE. ЖН И Ж (ШШЕ E 10.0ms， 你 推断 真实 的 时 钟 频 率 是 多 少 ? 

9,10 ++ 

Е-Е, CERERA sleep 和 times ЖЕГЕН ТЇШ kak. АНЕ ЖҰ 
上 编译 并 运行 这 个 程序 。 试 着 找 出 两 个 不 同 的 系统 ， 它 们 产生 的 结果 至 少 相 差 两 倍 ， 

9.11 € 

我 们 可 以 用 周期 计数 器 来 生成 活动 的 trace, 就 像 图 9.3 和 9.5 所 示 的 那样 ,使 用 蜀 数 start. counter 
和 get counter 来 编写 一 个 阴 数 : 


$include "clock.h" 


int inactivedurationíiint thresh); 





же; 非 活动 的 周期 数 ， 


放 修 函数 不 断 地 检 骨 周期 计数 占 ， 并 察觉 什么 时 候 两 个 连续 的 恋 之 间 相 状 多 于 thresh 个 周 
期 ， 这 表明 这 个 进程 已 经 处 于 不 活动 状态 了 。 返 回 这 个 不 活动 状态 的 持续 时 间 《 以 时 钟 周期 为 单 
(М). 

9,12 % 

ҚОЗ ЖАП ТАРТ sleeptime 等 于 2 19 Р mhz( 图 9.10): 系 统 的 计数 器 间隔 为 10ms。. 假 设 sjeep 
是 按照 下 面 这 样 的 方法 来 实现 的 。 处 理 器 维护 一 个 计数 器 ， 每 次 发 生计 数 器 中 断 时 ， 它 都 加 1。 当 
系统 执行 sleep(x) 时 ， 且 . 当 这 个 计数 器 达到 t+ 100x 时 ， 系 统 调度 这 个 进程 重新 启动 ， 这 里 1 是 计数 
i8) А ЇН 

А. W w RRETH sleep, ВААР Л RAR. ЕРШЕН. ӨНЕТІН 
等 各 种 开销 ，w 的 取 值 范围 是 多 少 

В, 假设 一 次 调用 mhz 得 到 1000.0。 肖 次 忽略 各 种 开销 ， 真 实 的 时 钟 频率 可能 的 范围 是 多 少 ? 


练习 题 答 案 


练习 题 9.1 ЖЖ 

一 开始 ， 中 新 CPU， 并 执行 100 000 个 周期 只 为 了 处 理 -- 次 击 键 看 上 去 很 荒唐 。 不 过 ， 当 你 
仔细 研究 一 个 这 些 数 据 ， 就 会 清楚 CPU 上 的 整个 负载 是 相当 轻 的 ， 

100 WPM XI Pv T- SEP? 10 次 击 键 。100 个 输入 者 每 秒 使 用 的 周期 总 数 会 是 10 x 10^ x 10 = 10, 
也 就 是 处 理 器 能 够 提供 的 总 周期 数 的 10%. 


& 188092 答案 

这 个 疝 题 需要 和 仔细 地 研究 这 个 trace， 这 拌 就 会 预期 出 模式 的 类 型 。 

A, 它们 每 9.98 一 9.99ms 发 生 一 次 ，358.93，368.91,， 378.39, 188,68, 398.86, 408.85, 418,83. 
428.81。 注 意 ， 没 有 用 射 体 表示 的 那些 数字 是 由 前 面 一 个 时 间 加 上 9.98 得 到 的 。 

B. “A” 中 用 斜体 表示 那些 时 间 。 它 们 引起 一 个 新 的 不 活动 展期 。 

С, 除了 世 在 执行 其 他 进程 上 的 时 间 以 外 ， 不 活动 时 间 还 包括 花 在 朗 务 两 个 中 断 上 的 时 间 。 


590 59% 


D. 我们 网 进程 每 20.0ms EAE 9.5ms. {АДАН 47.5%. 


练习 题 9.3 ЖЖ 


YR XB ЖОЙ. АС 1А) "P ШІЛ s ТЕ ERU ER EP tB Pr ip, ОНИ ЕНЕ TUR POT E ft. 
内 核 模式 中 . 


A| 5 . ] лү 8 T -A..] A ше 


Büu + 305 
Au AU AS Ru Ви Bu BU Ва Hu AS Au Au Au Au BS BU Bu Bu B8 Bu AS Ru Au Au АЗ 
练习 题 04 管 案 
这 是 外 很 有 趣 的 思考 题 。 它 帮助 你 推导 出 能 够 导 敏 CERE lB] УГ п НЕШЕГЕ] Е. 
К ИНН Г BM Ubi: 
最 小 什 
BAH 





0 10 20 30 40 50 60 70 80 


AFERRA Л ERIA EERTE 10 НИЛ УТ АТ Е. EA [8] 70 ARRS AE ТАТ E 
Бы, 得 到 总 时 间 风 好 超过 60ms X] T- HR B fii, 片断 刚好 在 时 间 О RERO SEA h УМ ИЙ. 
ТП НЕМЕКЕ) 80 ЯКЫ RED СЕ, НАМЕ И А Е 80ms. 

练习 题 9.5 答案 

这 个 习题 现 求 思考 的 是 记 账 【 失 couning) 方法 上 作 得 如 何 。 当 进程 是 河 动 时 ， 发 生 了 了 次 计数 
ЖЕЛТ. ЕЗІН trace 中 ， 进 程 看 用 户 模式 中 运行 了 的 .7?ms， 而 看 内 核 横 式 中 运行 了 33ms. ИЖ 
Жын НИЕ ГАЗ ИДИТ [8] 7063.7 + 3.3) = 1.04Х. 

练习 题 9 6 % 

iX 2] ЕХЕННЕНШ А КЕШЕНЕ ЕК Ж. UA A TAIPEI Ee ЕН. 

ЖЕ RB. RIGE Pme: 

C +m + p + d = 399 
c+d=133+1 
с+р=317 

НЕН, ПНДЕ с=100, d 33. p=217, [| m= 49. 

练习 题 9.7 5% 

XB АА О ЖЕ ZH] S]. :个 简单 的 进程 调度 模型 上 . 它 说 明 当 时 了 接近 于 进程 时 间 极 限时 ， 
dk T8 PE TR E ЕН IH ЖЕУ ЛЕ Ж. 

A. ЯТ < 50, 运行 在 “个 时 间 段 内 的 概率 是 1-850。 对 于 > 和 ， 这 个 概率 是 0. 

B. 于 于 1! 空 和 我们 永远 也 不 可 能 得 到 一 次 试验 ， 它 在 一 个 进程 时 间 段 内 执行 完毕 。 对 于 1 < 
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50, ЛЕЛЕ p= {50-50， 因 此 我 们 会 期 望 Ур = 150/(50- (XE 13. HF (= 20， 我 们 预期 需 
E sexy. Т = 40， 我 们 预期 需要 15 次。 


练习 题 88 答案 

这 是 Unix 版 本 的 Y2K ЫН. 3:8 A FA E Т w ta E — E ЕШКІ. БН Ү2К 
—}{, КЕНЕДЕН Rw B ТУДЕЙ. 

这 样 的 事情 会 在 ТОЖ ЕЛЕНА БАЕ. Ж 20382 1 B 19 HR 3:14. 
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10.13 Л 
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一 个 系统 中 的 进程 是 与 其 他 进程 共 京 CPU 种 主 存 资源 的 。 然 而 ， 共 学 主 存 会 形成 一 些 特殊 的 挑 
战 。 随 者 对 CPU 需求 的 增长 ， 进 程 以 某 种 合 型 的 平滑 方式 慢 了 下 来 。 但 是 如 果 太 多 的 进程 震 要 太 多 
岗 存 悄 器 【memom )， 那 名 它们 中 的 一 坚 将 简单 他 根本 赤 法 这 行 。 当 一 个 村 大 井 出 空间 时 ， 它 器 会 
成 为 那个 运气 不 好 的 程序 。 

仔 储 右 还 很 容易 被 伏 坏 ， 如 果 某 个 进程 不 小 心切 了 另 一 个 进程 使 用 的 存储 器 ， 埋 么 进程 可 能 避 
某 种 完全 和 程序 思 辑 大 关 的 邻 人 迷惑 的 方式 失败 。 

为 了 更 加 有 北 地 管理 存储 器 并 且 少 出 错 ， 现 代 系 统 提供 了 pu ЕНН 3 Б. niis do 
85 (УМ). ЕНЕ ВАТРЕ. АЫ ЮНЕ. л. ВУСНАЕ н, Е 
为 每 个 进程 提供 了 -ARE -MA Xue. Ла УМЕН ВТЕ], ЕЛЕНЕ І 
ЖШ ҢЕЛ: ЕНЕНЖНЕ- МЕНЕН ІНІНЕН Ж А, ЖЕН ОМ 
ің, Л S ЕЕ E {Т У.Н ЖІ, ЖОАЯЛА, "Cm ЖАЙ T Ел: VAN 
ЛАШ Т— ER hb [в], AGAST TERRE, COH ТЕМЕН НЕЛЕ TE [8] AP АМЕ 
TERM. 

ME UPS AVAL ЖЕТЕККЕ Н Е ЗЕ RAR Е USA Hh. H 
ӘЙ ЕН, AW MHEFIBnEHER С. ҚАРЫ СА ТЕАИ 6. A( o n EIE 
MM ЕН ҮЛЕ? БЕ FL ADM: 

e EAS TuS. МЕЕН ИАТА ЕШ. {ШЙ ТЮ. LR. 8E 

ЖБ. ЛЫ. ENDE. CHRED ERRA ЖЕНЕ. Ж! ПЕШ TAS ROS HBD 
你 更 好 地 理解 系统 通常 是 如 何 工作 的 。 

和 庶 拟 于 储 器 是 强 大 的 。 串 拟 存储 器 给 予 记 有 几 程 序 强大 的 能 方 ， 可 以 创建 和 和 破坏 存储 器 块 、 
将 仔 情 器 块 责 射 到 矿 盘 文件 的 某 个 部 分 ， 以 及 与 其 他 进程 共享 他 入 器 。 比 如 ， 你 知道 你 订 
以 旭 过 该 写 丰 情 器 位 置 读 或 者 修 收 一 个 磁盘 文件 的 内 容 吗 ? 或 者 是 你 可 以 如 载 A EDS 
内 容 到 存储 嚣 中， 而 不 需要 进行 任何 显 式 地 搂 页 苇 ? 理解 虚拟 存储 器 将 帮助 你 利用 它 的 强 
A Tife (ED: B5 pe Hi FR PPP RA) - 

e SL ER k Era. SOXNEHEEUTSIR — AER. | ЫШ ЖЕН. ӘЖЕНІ ЛИ 
如 malloc ҰРУ ӨЛІДЕН, TEE ИШ ТЇЙ S ЖЕН. MW EEST: Т 
^7. МАРВ АЫ ЫТЫ АЕТ НЫ. ЖШ, УНЕ BUREAU, aji 
VENAT Мн. ай ei] RR ГЕНЕ ВЕ 2 BU ERA АКА FOL dE. 或 
НЕ САТАТЫН 4 uA. ШЕЛЕЙТ Н. БЕН Ей. ШОШ malloc 
ЗЕРЕН ESSE РАС, TA Н ЖАНЕ. 

R FARATE ЖАПЕ ШАШТЫ. ЖЕН — BU) VS ie rikaa ADT i ЕН. Ио 
2H 18 VS B] P FERRI: ИИ B HIRE SE RISE, Jon Ия ЕНЕ SIR B k. ЖЕН 
X87; A BLUR сел. Ж НАДА RRE ШЕЙН, АНТ ГИЯ) 个 小 系统 的 虚拟 存储 
ALEL T AEMT ARSH ЛК ЕЛЕ BI H. 

3 ab ЖЕУ {НАШЕ О bm. ШЙ и T nt o ih e АЛП ДЕШТЙ Ж. oie 
2x SU fA IE. TARA A РЕ КАН malloc ЖЛЕ ШАРЕ ай ТЕН ЖЕЛЕГИН. kaspin 
Wish. КИШТЕ Ж CEFTA XE ЗЕ ЛИНИ ЕН Йи. EE tu REEL HORA. 
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10.1 物理 和 虚拟 寻 址 


计算 机 系统 的 主 存 被 组 织 成 一 个 由 M 个 连续 的 字 节 大 小 的 单元 组 成 的 数组 。 每 末节 都 有 -个 惟 
一 的 物理 地 址 physical address，PA)。 第 一 个 字 节 的 地 十 为 96， 接 下 来 的 字 节 地 址 为 1， 再 下 一 个 
为 2， 依 此 类 推 。 给 定 这 种 简单 的 结构 ，CPU 访问 存储 器 的 最 上 自然 的 方式 豆 是 使 用 物理 人 地址。 我们 
把 这 种 方式 称 为 物理 寻 址 (physical addressing), 101 展示 了 一 个 物理 寻 址 的 水 例 ， 该 水 例 的 上 
下 文 是 一 条 加 载 指令 ， 读 取 从 物理 地 址 4 处 开始 的 字 。 





101 一 个 使 用 物理 寻 址 的 系统 


当 CPU 执行 这 条 加 载 指令 时 , 它 会 生成 一 个 有 效 的 物理 地 二， 道 过 存储 器 总 线 ， 把 它 传 递 给 证 
仔 。 主 存 取 出 从 物理 地 直 4 处 开 娟 的 4 字 忆 的 他 ,并 将 它 返 回 给 CPU, CPU ETECATEIGE Т fr 
ñi H, 

早期 的 PC 使 用 物理 导 址 , fü HL iñ S АКШ. 嵌入 式微 控制 器 以 及 Cray 超级 计算 机 这 
祥 的 系统 仍然 继续 使 用 这 种 寻 址 方式 ， 然 而 ， 为 通用 计算 设计 的 现代 处 理 器 使 用 的 是 虚拟 寻 赴 
(virtual addressing), ЖЕ 10.2. 


CPU 35 “е 


mummuakkumu ина... LNHHd һы... rr 


ч озш Оос е 





fier 
图 102 一 个 使 用 虚拟 寻 址 的 系统 


598 X 103* 

Bde hb. CPU iB 1$ ERA E RR AE. (ушшш address, УА) ЖӘНЕН, ux mind debt 
ЕЗІНЕ АННЫ PORE Hh 3 АРТЕ BEES ДЖ RI Hi hk A E ЖШ. di 
ЯР (address translation). Ж {@ E 6EER— 43. Hal ИШТЕЕ Ж CPU BF FW: $c nme e jr. 
CPU 45 Fr ЕКИ MMU (memory management unit, AE EY E 4) FB, B| H Fr E ЕН 
Biri kay ШЕПНЕН. КЖ ЖЕНИ Ж ЕЕН. 





102 地址 空间 


hk Ч 18] Caddress space). Ë— ЗЕНА НЫНЕ doa, 
{0, 1, 2, =] 
in S bs fep e qe. 2 ТЕ RE sk НЕГ] flinear address space 3. 
^ TERI E. RI EE ЧЕНЕ E НЕКЕ ЖЕЕ. tfE— da И ЖЕК) EP. CPU 
时 一 个 有 Na2" ННІ eb td: КЕ А b, 过 个 地 址 空间 称 为 虚 扫 地址 空间 ( virtual address 
space l: 
|0, 1, 2, -“, М1). 
КИНЕ Kol СЕ ЕЗ f Ac je p Rr E hi ly ЖЕЕ. 例如， 一 外 和 包 音 中 = 关 个 地 址 的 
皮 报 地 址 空间 就 叫做 一 个 于 位 地 址 空间 。 现 代 系 统 和 HH NEM 32 pr 6s FH SS. 
一 个 系统 还 有 一 个 物 理 地 址 密 间 (physical address space), ЕЗЯНФИВЯНМИЕЙ М 个 字 节 
相对 应， 
[0. 1, Z, =", М-1|. 
MAREELE ТРАЕ ТОЧЕН. ЖИН ме". 
ЛИЕ ЖЕКЕ. ЩЩ» SIAC T Kar 9 (EW) 可 它们 的 属性 地址) 
一 且 我 们 认识 到 了 这 种 区 别 ， 那 冬 我 们 意 可 以 概括 总 站， РРА ТУЕ ТУГ ОНА АЕ, И 
АЕТ НЬ AAA a SEP ОГТ И, ВЕЧЕ high + 
选 目 虚 扫 地址 空间 的 虚 氛 地址 ， 和 个 选 自 物理 地 址 空间 的 物 蛋 地 引 ， 


МЕЈ 10.1 
KAK F hi kk, H SiA МАН, ЖЕЛЕН М. AFH, к< 
[T| Ме2(й, Wm). бал” (+j. Tin) T=29 (Zi) Pal (ЖАҒА), En 2? 


(ЖЖ |, 


ЗЕЕ іп? EIS KORR S CAD 
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103 ”虚拟 存储 器 作为 缓存 的 工具 


概念 上 而 言 ， 虚 拟 存储 器 СУМ) 被 组 织 为 一 个 由 存放 在 磁盘 上 的 N 个 连续 的 字 节 大 小 的 单元 
组 成 的 数组 。 每 字 节 部 有 一 个 惟一 的 虚拟 地 址 ， 这 个 惟一 的 患 拟 地 址 是 作为 到 数组 的 索引 的 。 磁 盘 
上 数组 的 和 内容 补 刍 存在 主人 让 中 。 和 存储 器 层次 结构 中 其 他 缓存 一 样 ， 磁 盘 〈 较 低层 ) 上 的 数据 被 分 
Әк, ДОМЕН ҒТА (ҢЫ) 之 间 的 传输 单元 ，YM 系统 通过 将 虚拟 存储 器 分 割 为 称 
ABA Cvirtual page: VP). 的 大 小 固定 的 块 ， 来 处 理 这 个 问题 。 每 个 虚拟 页 的 大 小 为 p= 22 Е. 
类 羽 地 ,物理 存储 器 被 分 割 为 物理 页 (physical page，PP)， 大 小 也 为 了 字 节 【物理 页 也 被 称 为 页 筑 ， 
page frame). 

(FERREA, RETRO УУ — НІ: 

. GNE: VM 系统 还 未 分 配 【或 者 创建 的 页 。 术 分 配 的 块 没有 任何 数据 和 它们 相关 联 ， 

因此 也 就 不 卢 用 任何 磁盘 宅 间 ， 

. 组 存 的 ， 当 前 缓存 在 物理 存储 器 中 的 已 分 配 页 。 

. KEFY: КЕЛЕТ ЕТ ЕҚ. 

图 10.3 的 示例 展示 了 一 个 有 8 AERAR НЕШ ЯН Ы. ЖІП 0-5 还 没有 被 分 配 ， 因 此 在 
БН DXRAMEX. БЫЛ. 4 和 6 被 缓存 在 物理 存储 器 中 。 页 2、5 和 了 己 经 被 分 配 了 ， 但 是 当前 
并 未 组 存在 主 在 中 ， 





^ | ЖЖ DAAM 中 
et 的 物理 页 (РР) 


10.3 一 个 砷 拟 存储 器 系统 是 如 何 使 用 主 存 作为 缓存 的 


10.3.1 DRAM Sis E (ERSSB ER £44 

23 T tii Si E REGE E CAS E US RETE UE CS. 我 们 将 使 用 术语 SRAM 317 
T CPU 和 主 存 之 间 的 L1 AL 高 速 缓存， 并 且 用 术语 ПВАМИЯЖЕ i UEERERR RAKET, 
ЕЕЕ, 

在 存 情 层次 结构 中 ，DRAM 缓存 的 位 置 对 它 的 组 织 结构 有 很 大 的 影响 。 回 想 一 下 ，DRAM E 
SRAM 要 慢 大 约 10 ë, MERE EG DRAM RAH 100 000 多 倍 。 因 此 , DRAM 缓存 中 的 不 命中 [miss) 
比 起 SRAM 缓存 中 的 不 傅 中 要 昂贵 得 和 多， 因为 DRAM 缓存 不 命中 亚 由 磁盘 来 服务 ， 而 SRAM 缓存 
不 命中 通常 是 由 基于 DRAM 的 主 存 来 服务 的 。 而 且 , 从 磁盘 的 一 个 遍 区 读 取 第 一 字 节 的 时 间 开 错 比 


起 读 这 个 局 区 中 后 面 的 字 节 要 慢 大 约 100000 倍 。 归 根 到 底 ，DRAM 缓存 的 组 织 结构 完全 是 由 巨大 
的 涉 命 中 开销 驱动 的 。 
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ИША КАЕН ТЇ НИЛ ТЕН, denn ik. алар 4-Яқв. TK 
ЖЕНЕ, DRAM B r Rk НК. ШЕШ, {ЕГШ ША ГЕ Were (eer m р, 不 
rPH PIB W SIB Ж. [HOS UA Trid W ish ER 2 W. 因此 ， 比 起 硬件 对 SRAM #8 
Tr. BRE RSES DRAM WL y EH TE НЕНИН Саш ЕШШ THO GIH), 
Ек, EE wË BB DR IF URBE ШШК. DRAM 58 fe АНУ Сетек, IÚ T E B S 
Cwrite-throagh ). 


1032 ms 

HEAR- ИШТЕ ЕЖЕ D IN R Rk ЖА — ИИ E S Trik: DRAM 中 的 某 
ТЕЛ, ШЕН, ЕНИЯЛВТИЕЗИНІН НЕЕ ТЬ. (acra. ЖЕНИ 
TEE TII ERES МИЯ, CARTA PER +AA. WWW ABRE 
DRAM F. М-ДЕ. 

AEAEE dT Ei HE ANGE, Rin. НЕЕ ВЕРЕ. MMU (СІНЕ) 中 的 地 
ШШЕ, Rn trik m ép up rm RETE K Cpage table) ЕНЕҢ, oed dri RU 
War. hXHbhH BEAR i RU FER U EHE BRE. тейт, MERO EP 
WX AT. URTEA DRAM 之 间 来 回 传送 页 ， 

图 10.4 懂 平 了 一 个 更 表 的 基本 组 织 结构 ， 页 表 就 是 一 个 PTE (page table entry. 2 А48 > 
КО. ННІ К fg rS) ARIETE e CEPIT HA ИНЕ PTE. ІЗІНІҢ, & 
[ERRELE PTE 是 由 一 个 有 野性 【walid bity RP п {ТЮКЕН S ЖА ЕТ ЕШШ 
И ШДЕТ Г {ЕК DRAM P. m RS ТИЯ. ЖАНЕ Жл DRAM (mie pss gi 
ИУ. dest SL HERE T silu. ШЕННЕН), NAE Shu В 
цияны. SIM, Iib UR Ede dE dg hl Ж. 

















ки Ж B t е И РЫЙ (ОНАМ: 
EET ue] mi PP 0 
PTE0[ 0] ma =" 252 2 02 
TEST 
т ҮШ. Е T4 јррэ 
|І ы. 4- 
|1] | 
$1 — 2. иша (ша) 
РТЕ 71.1 S^ . [ ж 1 
ҥш = ~= VER] 
(DRAM) ` L 3 | 
` L Ww |) 
T Wë | 
[ Wr] 
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图 10.4 ИШ Г — T 8 ТУС АТА TEB W НЕ CE ОТЕ СҮРІ, VP. 
YP4 和 VPT) ЗЕЕ DRAM dh. ЖЕП (Ұрп 和 Уре) 还 束 被 分配 ， 而 利 下 的 下 (VP3 和 
ҮР) CHENE Г, BESWEER ТГ. H 10.4 中 有 一 个 要 点 要 社 意 ， 因 为 DRAM BT R + 
相 联 的 ， 性 意 物 理 页 都 可 以 世 音 任意 虚拟 页 ， 
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5 10.2 
Ж ЖСК РАМА XS (n) “АХАЛ (Р) 的 组 合 所 需要 的 PTE 数量 : 





10.53 页 命中 

考虑 - FO CPU 卖 虚拟 存 情 器 的 一 个 字 峙 ， 它 被 WP2 包含 且 被 组 存在 DRAM 中 ， 会 发 生 什 么 
(参见 图 105)。 使 用 我 们 将 在 10.6 节 中 详细 描述 的 -种 技术 ， 地 址 猎 译 硬件 将 弄 氛 地 址 作为 一- 个 
索引 ， 来 定位 PTE2， 并 从 存储 器 中 读 取 它 。 说 然 设置 了 有 效 位 ， 那 么 地 址 翻译 硬件 就 知道 VP 是 
缓存 帮 下 储 器 中 的 了 ,所 以 它 使 用 PTE 中 的 物理 存储 器 地 址 (该 地 址 指向 PP0 中 缓存 页 的 起 始 位 置 )， 
构造 出 这 个 空 的 物理 地 址 。 


ТТ HEHH у МЕННЕН (DRAM? 
Rš ЖҮ har 
L l жағ FPO 






PTEO[O| ` nui p” 
E 


[1 





ІЯ b T$ | 
的 而 表 (DRAM) . EE CENE 


- ——— — — 


图 10,5 YM 页 命中 
对 WP2 中 -个 字 的 引用 就 命中 了 。 
10.34 т 

让 虚拟 存储 器 的 习惯 说 法 中 ，DRAM RT DR RARA (page fault), A 10.6 Jo T. bb B 
之 机 我 们 的 不 例 页 表 的 状态 。CPU 引用 了 МРЗ 中 的 一 个 字 ， 这 个 字 并 未 缓存 在 DRAM "B. НН 
主人 硬件 从 存储 器 中 读 取 PTE3， 从 有 效 位 推断 出 VP3 未 被 缓存 ， 并 且 和 触发 - .个 缺 页 异常 。 

息 页 蜡 常 调用 内 核 中 的 缺 页 异常 处 理 程序 , 该 程序 会 选择 - 个 牺牲 页 , 在 此 例 中 就 是 存放 在 PP3 
中 的 ҰРА. WIR. УРА 已 经 被 修改 了 ， 那 么 内 核 就 会 将 它 拷贝 回 感 盘 。 无 论 嘲 种 情况 ， 内 核 都 会 修改 
УРАЛ ЖАН, KEE VPA 不 再 缓存 在 主 存 中 这 一 事实 。 

J POK, РОЛАН UU УР3 到 存 情 器 中 的 PP3， 更 新 PTE3， 随 后 返回 。 当 旦 常 处 理 程序 返 
加 时 ， 它 会 重新 局 动 导致 馈 页 的 指令 ， 该 指令 会 把 导致 缺 页 的 虚拟 地 址 重 发 送 到 地 址 翻译 硬件 。 但 
EMA, YP3 已 经 缓存 在 主 在 中 了 , 那么 页 命中 也 能 由 地 址 翻译 硬件 正常 处 理 了 , 就 像 我 们 在 图 10.5 
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中 看 到 的 那样 。 图 107 Bec ТЕЕ I RETE IRE ER Б. 
ЕКІ еі р е ир & тағын DRAM)? 
TPT — 
|! aw __— МЕТ 1 РРО 
е 
== 24 ҰРА | рз 
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Р. жырын сй) 
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图 10.6 УМ@Д (之 前 ) 
对 VP hF ТОФ. Hm TW. 
аш тн ш TH iH DRAM) 


Г] _ шіні 
-一 „ы - PP 0 







d uat 
[ wP1 | 
мм [| VEZ | 
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ІН 10.7 VMN 【之 后 ) 
ЖАБАГИЕВ YPs IEAA, EARS EH ҮР ТИП: АЕ, ОЙ АЬР ЕНӘ НЕ С. REOR 
REDIERE, ШЕЕ ЕНЕ. 

EAM НЕЕ 20 世纪 60 年 代 早期 发 明 的 ， 远 在 СРИ- ШЖ} [н EE P) p c3 a = sk 
SRAM r 2 W. ЕН. БЫНЫ ЖИЕН T RI SRAM ATTAN, ШЕТ ПИКЕ Ш> 
RBS. EERTE, жыл. ЕКЕШ ИЕШЕ? I eO RELIER е 
Ж (swapping) 或 者 页 面 调度 (paging). TL А (ШЕЛЕЙА) DRAM， 和 从 DRAM Ж 
出 到 【或 者 页 面 调 出 到) WES. АЗН, АРСЕН, BR ES ЖЕТЖ ЕН. ЯМАН 
面 的 这 种 策略 被 称 为 接 需 页 面 调度 《demand paging)。 其 他 的 方法 也 是 可 裔 的 ， 钢 如 党 试 音 世 测 
44. EXIEIRSIRANIUAA KU. ВИ, SER Fk kn GEI RE TUN WOES 
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10.3.5 分 配 页 面 

图 10.8 展示 了 当 操 作 系 统 分 配 一 个 新 的 虚拟 存 情 器 页 时 ， 对 我 们 示例 页 表 的 影响 ， 例 如 ， 调 用 
malioc КЕҢ, 在 这 个 示例 中 ,通过 在 磁盘 上 创建 空间 ， 并 更 新 PTE5， 使 它 指向 磁盘 上 这 个 新 创建 
的 页 面 ， 从 而 分 配 VP5， 


物理 页 号 或 者 
ЖАНН Р CORAM) 





x: > 虚拟 存储 器 《磁盘 ) 
ere 7| 1 Du ` КТА БЕ 


БЕ РЗ 
(DRAM) - 


ss 
| 
L 


» 


3s 
^ 


” 








| 
k 


图 10.8 分 配 一 个 新 的 虚拟 页 面 
内 核 在 磁盘 上 分 配 VPS, 3FH38 PTES 指向 这 个 新 的 位 置 。 


10.3.6 局 部 性 再 次 搭救 

当 我 们 中 的 许多 人 部 了 解 了 虚拟 存储 峰 的 概念 之 后 ， 我 们 的 第 一 印象 通常 是 它 的 效率 想必 是 非 
弟 忙 。 假 设 不 命中 处 黑 很 大 ， 我 们 会 担心 页 面 调度 会 破坏 程序 性 能 。 实 际 上 ， 虚 拟 存 储 器 工作 得 相 
当 好 ， 这 主要 归功 于 我 们 的 老 朋 友 局 部 性 locality )。 

尽管 在 整个 运行 过 程 中 程序 引用 的 不 同 页 面 的 总 数 可 能 超出 物理 存储 器 总 的 大 小 ， 但 是 局 部 性 原 
则 保证 了 芷 任意 时 刻 ， 这 些 页 面 将 趋 问 于 在 一 个 较 小 的 活动 页 面 【active page) 集合 上 工作 ， 这 个 集 
AURIS (working set) 或 埋 常 驻 集合 【resident set。 在 初始 开销 ， 也 就 是 将 工作 集 页 面 调度 到 
仔 储 器 中 ， 之 后 ， 接 下 来 对 这 个 工作 集 的 引用 将 导致 命中 ， 而 不 会 产生 额外 的 磁盘 流量 。 

只 要 我 们 的 程序 有 妇 了 的 时 间 局 部 性 ， 虚 氢 存 储 器 系统 就 能 工作 得 相当 好 。 查 是 ， 当 然 ， 不 是 
所 有 的 程序 都 能 展现 良好 的 时 间 局 部 性 。 如 果 王 作 集 的 大 小 超出 了 物理 存储 占 的 大 小 ， 那 么 程序 
将 产生 一 种 不 位 的 状态 ， 叫 做 其 奖 〈thrashing)， 这 时 页面 将 不 断 地 换 进 换 出 。 虽 然 虚拟 存储 器 通 
前 是 有 效 的 ， 但 是 如 果 一 个 程序 性 能 慢 得 像 肛 一样， 那么 晓 明 的 程序 员 会 考虑 看 是 不 是 发 生 了 首 
B. 


Bu. SUSAN 
你 可 以 利用 Unix 的 getrusage 4E LR АКЕ (АДУУ Je 8. ), 


104 点 拟 存储 器 作为 存储 器 管理 的 工具 
下 上 一 三 中 , 我 们 看 到 虚拟 存储 器 是 如 何 棍 供 一 种 机 制 , 利用 DRAM 来 缓存 来 自 通 党 更 大 的 虚 


802 ЯЕ: 


ШЕ ШШ. АНА ЈЕ, -ER R, ШШ DEC РОР-11/70. E M 8)E— НИЕ ei 
WB ЛЕША Н. ЖІП, ЕНЕНЕ i — 1-6 HEEL, Eom X АСНЕР АЕ, 
ЕНЕ f Т RM BTE. 

mH Aib. 我们 春 假 设 有 一 个 单独 的 页 表 ， 特 一 十 虚拟 地 址 空间 映射 到 物理 地 址 空间 。 实 
bx E. ВЕЖА АРТЫ ВНА T —T rd arde. DR ih] o a — 1-а or fep diet ab fn]. 图 10.9 
ERTAS. CETERA P. EA i HA ҮРІ 映射 到 РР2, УР B H РРТ, НЫН, 
ШЕШІНЕ VPI 到 PP7, VP2 映射 到 PPI0。 ЕЙ, e dede dCi nr Ela dr RI] — КЗ 
页 面 上 。 


теч RI 


ЕЕ 


ФЕ | 





图 10.9. ум 如 何 为 进程 提 殿 独立 的 地 址 空间 
КРЕ КЕРРИ TRINN. 


ККЖ OC do E HERR Э К] M EL i 979 18] ОЕ rt] SE fr ИЕНЕН Н НЕН Т COL E II. 
THA. VM 简化 了 链接 和 加 载 ， 划 享 代码 和 数 独 ， 以 及 对 应 用 分 配 存 人 器。 


1041 简化 链接 

HAETI pah ЖЕЕ И ШЕ ПНЕ Ж. ТЕЕ СНЕ k EY 
ЕЕЕ ТИПНЕ. іт, SET- Linux Ж ЕИ 10.10 Brot. 

SCA R. M, L E 0x080d48000 КНН. М E M ИЕ Ох ІІ ЕНІ, ЖОКЕДЕ 
AE Mise Ox40OQ0000 处 开始 ， 而 操作 系统 代码 和 数据 总 是 从 地 址 Oxeo000000 Fih. ik i5 — 8t 
极 去 地 简化 了 链接 器 的 设计 和 实现 ， 区 许 链接 器 生成 全 链接 的 可 执行 立 件 ， 这 些 可 执行 训 忻 是 钉 立 
下 物理 存 依 喷 中 代码 和 数 指 的 最 绽 位置 的 ， 


10.42 ШНЕНЕ 

АЕ ЕЕЕ НЕЕ ГАНЕВ REB LnmExm- SE. —m 
而 言 ， 每 个 进程 地 有 自己 稳 有 的 代码 ， 数 据 、 堆 以 及 槐 区 域 ， 是 不 和 其 他 进程 共享 的 。 在 这 种 情况 
Ші, MERERI TTA, РЕ ЕАН НІН ТІП, 

КҚ, fcm gp. ЕЕЖЕНБЕНЖЕЕЛІНЕН. ИШ. АРТЕ SRUR FEL dE Fl] MW E 
BEIC. Пас ЕРЕН ЕЕ ІНЕ, ЕШ prin. ЕЕЕ 
所 当 的 虚拟 下 面 队 射 到 相同 的 竟 理 页 面 ， 从 而 安排 密 个 进程 苇 享 这 部 分 代 加 的 一 个 拷贝 ， 面 不 是 在 
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图 10.10 — Linux 进程 的 存储 器 映像 
程序 总 是 从 虚拟 地 址 0x8048000 Eb TERR. PHP E83 E A d HEU MF Ox PETERE TT, 33S Н Bn di M t ULM RE 0x40000000 
处 开始 的 区 域内 ， 


10.4.3 简化 存储 器 分 配 

虚拟 仓储 器 为 癌 月 户 进 程 提供 一 个 竹 单 的 分 配额 外 存 情 器 的 机 制 。 当 -- 个 运行 在 用 户 进程 中 的 
EFRR RETER Ain AA malo 的 结果 )， 操 作 系 统 分 配 一 个 适当 数字 【例如 上 ) 个 连 
续 的 虚拟 存储 器 和 负面， 并 上 且 将 它们 映射 到 物理 存储 器 中 任意 位 置 的 k 个 任意 的 物理 页 面 ， 由 于 页 表 


工作 的 方式 ， 操 作 系 统 没 有 必要 分 配 k 个 连续 的 物理 存储 器 页 面 。 页 面 可 以 随机 地 分 散在 物理 存 情 
器 中 。 


10.4.4 简化 加 载 

虚拟 存储 器 也 使 加 载 可 执行 文件 和 已 共享 日 标 文 件 到 存储 器 中 变 得 容易 ， 回 想 一 下 ，HELF пр 
行文 件 中 的 .text 和 .data 节 是 相 朗 的。 为 了 加 载 这 些 节 到 一 个 新 创建 的 进程 中 ，Linux 加 载 程序 分 孔 
了 -个 从 地 址 0х08048000 处 开始 的 连续 的 虚拟 贡 面 区 域 , 将 它们 标识 为 无 效 的 【也 就 是 未 缓存 的 )， 
并 将 它们 的 页 表 条 日 指向 有 目标 文件 中 适当 的 位 置 ， 

有 趣 的 -点 是 奸 载 器 从 不 真正 地 从 磁 检 中 拷 只 任何 数据 到 存储 器 中 。 当 每 个 页 面 第 一 次 被 引用 
时 , 虚拟 行 慷 器 系统 将 自动 并 按 需 地 把 数据 从 磁盘 上 调 入 到 存储 器 ， 页面 引用 或 者 是 当 CPU 取 一 条 
指令 时， 或 者 是 当 一 条 正在 执行 的 指令 引用 一 个 存储 路 位 置 时 。 

卫 射 一 个 连续 虚拟 页 面 的 集合 到 企 意 一 个 文件 中 的 在 意 一 个 倍 置 的 概念 叫做 存 钳 器 映射 
(memory mapping). Unix ЕРЕ J 0 mmap 的 系统 调用 ， 允 许 颇 用 程序 进行 自己 的 存储 中 上 映 
Bf. АПТЕ 10.8 节 中 更 详细 地 描述 应 用 层 存 赃 器 映射 。 
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性 何 现代 计算 机 系统 必须 为 操作 系统 提供 王 段 来 控制 对 存储 器 系统 的 访问 。 不 应 该 允许 -个 用 
户 进 程 修 卜 它 的 只 读 诡 本 段 ， 而 且 也 不 诺 设 允许 它 读 或 修改 任何 内 核 中 的 代码 和 数据 结构 。 不 调 该 
对 评 它 读 或 者 写 其 他 进程 的 私有 存储 器 ， 并 是 不 允许 它 修 改 任 何 与 其 他 进程 共享 的 赚 拟 页 面 ， 除 非 
所 有 的 共享 者 都 显 式 地 允许 它 这 么 做 《通过 调用 明 兢 的 进程 间 通 信和 系统 调用 })。 

焉 慑 我 们 所 看 到 的 ， 提 供 狂 立 的 地 直 空 间 使 得 分 离 不 同 进程 的 私有 存储 器 蛮 得 容易 。 但 昆 ， 地 
址 翻译 机 制 可 以 以 一 种 自然 的 方式 扩展 放 提 供 更 好 的 访问 控制 。 因为 每 次 CPU 生成 一 个 地 址 对 , 地 
ДЕЕ ТЕНЕ {КЖ sie 个 PTE, 所 以 通过 在 PTE 上 添加 一 些 额 外 的 许可 位 来 控制 对 一 个 虚拟 页 面 内 容 
的 访 癌 ， 十 分 简单 ， 图 10.11 展示 了 一 般 的 概念 。 


带 许可 位 的 页 表 
SUP READ WRITE ”地 址 


" — — 


МР0: | No Yes| No | PP6 
进程 i ҰР1:| No Yes | Yes РР4 s 
VP2:| Yes | Yes | Yes PP 2 












一 


SUP READWRITE ЕЕ 


ме” 
үрс: Мо | Yes. Мә Е PP 9 —— 


i — n iPP9 
НЕ | урт. | Yes Yes | Yes PP 5 : 
VP2.| No | Yas | Yes РР114---- PP 11 


ОЛІ 用 虚拟 存 情 器 米 提 供 页面 级 的 存储 器 保护 


在 这 个 示例 中 ， 我 们 已 经 添加 了 三 个 许可 位 到 每 个 PTE. SUP 位 表示 进程 是 否 必 须 运 行 在 内 核 
BRA 费 式 下 才能 访问 该 页 。 运 行 在 内 核 模式 中 的 进程 可 以 访问 任何 页 面 ， 但 是 这 行 在 用 户 
异 支 中 的 进 称 只 允许 访问 那些 SUP * 0 if 08. READ 信和 WRITE 位 控制 对 正面 移 读 和 写 访问 。 
ИШ. ЖЖЖ РЕ i 运行 在 用 户 模式 下 ， 那 么 它 有 读 УРО ЖЕҢ УР1 的 权限 。 然 而 ， 厅 人 允许 它 访问 
VP2. 

ШЖ- -条 沸 令 违反 了 这 些许 可 条 件 , 那么 CPU 就 触发 — 4 REPRE, 净 控 制 传递 给 - -个 内 
核 中 的 异常 处 理 程序 。Unix shell 典型 地 将 这 种 异常 报告 为 “ 段 错 误 (segmentation fault)”, 


-— 


10.6 地址 翻译 


这 一 节 讲 述 的 是 地 址 翻 详 的 基础 和 后记。 我 们 的 户 标 是 让 你 对 硬件 在 支持 虚拟 存储 器 中 的 胡 色 有 
正确 的 评价 ， 并 给 你 鼠 够 多 的 细节 使 得 你 可 以 亲手 演示 一 些 具体 的 示例 。 不 过 ， 右 记 住 我 们 省 略 了 
大 量 的 细 下 ， 匹 其 是 和 时 钟 相关 的 细节 ， 里 然 这些 细 节 对 人 恒 件 设计 者 来 说 是 非常 重要 的 ， 但 是 超出 
了 我 们 讨论 的 范围 。 图 10.12 EL T МИРА ИЕН ЕНГЕН, ЕЖ, 

地 址 船主 是 一 个 交 元 素 的 虚 扳 地 址 空间 (VAS) 中 的 元 嘉和 一 个 好 元 素 的 物理 地 址 空间 (PAS) 
中 元 素 之 加 的 映射 
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MAP:VAS—PASU Q 

这 里 

МАР (A) =A' IR dH BE A 处 的 数据 在 PAS 的 物理 地 址 A' 处 。 

= 0 ЖИА А 处 的 数据 不 在 物理 存储 器 中 ， 

Ed 10.13 展示 了 MMU 是 如 何 利 用 页 表 来 实现 这 种 映射 的 。CPU 中 的 一 个 控制 寄存 器 ， 页 表 基 
址 寄存 器 (page table base register, PTBR) 指向 当前 页 表 。n 位 的 虚拟 地 址 包含 两 个 部 分 ， 一 个 р 
位 的 VPO (virtual page offset, 虚拟 页 面 偏 移 ) 和 一 个 Са-р) 位 的 VPN (virtual page number, Hd 
页 号 )。MMU 利用 VPN 来 选择 适当 的 PTE, 例如 ，VYPN0 选择 PTE0, ҮРМІ 选择 PTE1， 以 此 类 推 。 
将 页 表 条 日 中 PPN (physical page number, 物理 页 号 ) 和 虚拟 地 址 中 的 VPO 串联 起 来 ， 就 得 到 相应 
的 物理 地 址 。 注 意 ， 因 为 物理 和 虚拟 页 面 都 是 P 字 节约 ， 所 以 PPO (physical page offset, 622 X dg 
(84%) 和 WPO 是 相同 的 。 














N= Жылан [8] th ЕШ E 
物理 地 址 空间 中 的 地 址 数量 


页 的 大 小 〈 字 节 ) 


нЕ 
| 





_PPO жне тї) _ ___ 
й 








LEER GE ba in 


图 10.12 ”地 址 翻译 符号 小 结 
图 10.14 (а) БХТ SHAR ДШ. CPU Ж ЧАТ ЕЕЕ. 
e P: 处 理 器 生成 一 个 虚拟 地 此 ， 并 把 它 传 送 给 MMU, 
。 第 二 步 ，MMU 生成 PTE 地 址 ， 并 从 高 速 缓存 / 主 存 请 求 得 到 它 。 
* Scd. REZET MMU 返回 PTE. 
e 第 四 步 ，MMU 构造 物理 地 址 ， 并 把 它 传 送 给 高 速 缓存 / 主 存 。 
e kg: 高 速 缓存 / 主 存 返 回 所 请 求 的 数据 字 给 处 理 器 。 
和 页 面 命中 不 同 的 是 ， 页 面 命中 完全 是 由 硬件 来 处 理 的 ， 而 处 理 缺 页 要 求 硬件 和 操作 系统 内 核 


606 第 10 章 


协作 冠 成， 如 基 10.14 (b), 





3 x xs 
Wiz, m mi d 
dux (YE) 


物理 地 址 
图 10.13 使 用 页 表 的 地 址 翻译 





(b) ЕД 


图 10.14 页 面 命中 和 缺 页 的 操作 视图 
VA: ШІНІҢ; РТЕА: ОЖЖ НЮАЕ: PTE: PEAH: PA, ЕНЕВ. 
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* 第 一 步 到 第 三 步 ， 和 图 10.14 GO 中 的 第 一 步 判 第 三 步 相同 ， 

e Gui. PTE 中 的 有 效 位 是 零 ， 所 以 ММО 触发 了 一 次 异常 ， 传 递 CPU 中 的 控制 到 操作 系 
统 内 核 中 的 忌 页 异常 处 理 程序 。 

e 第 一 步 ， 缺 页 处 理 程序 确定 出 物理 存储 器 中 的 牺牲 页 ， 如 果 这 个 页 面 已 经 被 修改 了 ， 则 把 
ЕА Ж. 

ЖАУ. 缺 页 处 理 程 页 面 调 入 新 的 页 面 ， 并 更 新 存储 器 中 的 PTE, 

. 第 七 步 : 缺 页 处 理 程 序 返 回 到 原来 的 进程 ， 驱 司 导 致 馈 页 的 指令 重新 启动 。CPU 将 引起 缺 
由 的 指令 重新 发 送 给 MMU。 因 为 虚拟 页 男 现 在 组 存在 物理 存 依 器 中 ， 所 以 就 会 命中 ， 在 
MMU 执行 了 图 10.14 (b) 中 的 步骤 之 后 ， 主 存 就 会 将 所 请 求 字 返 回 给 处 理 器 。 


АХ 10.3 
给 定 一 个 32 位 前 虚拟 地 址 空间 和 一 个 24 上 位 的 物理 地 址 ， 对 于 下 面 的 页 面 天 小 P. # z VPN. 
VPO. PPN 和 PPO 中 的 位 教 ， 


РЇ eveni | #VPO 位 | #PPN 们 | #PPO 
wm 





10.5.1 结合 高 速 缓 存 和 虚拟 存储 器 

在 任何 既 使 用 虚拟 存储 器 又 使 用 SRAM 缓存 的 系统 中 , 都 有 应 该 使用 碟 拟 地 址 还 是 使 用 物理 地 
址 来 访 占 高 速 缓存 的 问题 ， 和 尽管 关于 这 个 折 中 的 详细 讨论 已 经 超出 了 我 们 的 讨论 范围 ,但 是 大 多 数 
系统 十 选择 物理 寻 址 的 。 使 用 物理 寻 址 ， 名 个 进程 癌 时 在 高 速 缓存 中 有 存储 块 和 共享 来 自 相同 患 拟 
页 面 的 起 成 为 很 简单 的 事情 。 而 且 ， 高 速 缓 存 无 需 处 理 保护 问题 ， 因 为 访问 权限 的 检查 是 地 址 秽 译 
过 程 的 一 部 分 。 

图 10.15 展示 了 一 个 物理 寻 址 的 高 速 绥 存 如 何 和 虚拟 存 情 器 结 人 台 起 来。 主 槛 的 思路 是 地 址 翻译 
尼 竺 在 向 速 缓存 查找 之 前 。 注 意 页 表 条 日 可 以 缓存 ， 就 像 其 他 的 数据 字 一 样 ， 


Ban лии lt TT 


数据 [1 
BG 


81015 ЖЕЕНБАЕВ 
VA: Hif hb. PTEA. HH FTE: HREH: РА. ЯНА, 
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10.5.2 利用 TLB 加 速 地 址 翻译 

正如 我 们 看 到 的 ， 此 次 CPU 产生 一 个 虚 氛 地 址 ，MMU 就 必须 查阅 -个 PTE， 以 便 将 虚 氛 地址 
BEN Е НЫНЕ, ЖЕҢЕР, ЖЕЖ oW REB. КЕЛЕЛІ 
个 周期 ， 如 果 PTE ТЕЛЕ LI 中 ， 那 么 开销 就 下 降 到 1 个 或 2 个 周期 。 然 而 ， 许 多 系统 都 试图 
THER SIS ДЕЕ НН. CIE MMU 中 包括 了 一 个 关于 PTE 的 小 的 缓存 ， 称 为 TLB (translation 
lookaside buffer, #175 5-08 9 05). 

TLE ж). ВЫНА, HPE ITRE ЕН РАХ PTE BEES. ТІВ 28 
®Н ЕЕН» ШИН 10.16 所 示 ， 用 于 组 选择 和 行 匹配 的 索引 和 标记 字段 是 从 虚拟 地 址 中 的 虐 
拟 页 革 由 提取 出 来 的 ， 如 果 TLB 有 T=2 个 组 ， 那 么 TLB & 31 CILBD. 是 由 VPN 的 1 个 最 低位 得 
成 的 ， 而 TLB 标记 (TLBT) Ең VPN 中 剩余 的 位 组 成 的 ， 


n-1 231 np*t-1 pp 1 ü 


TLB 标 记 (TLBT) | TLB 索引 (TLB) | УРО 


— ————————4 
YPN 


10.10 一 个 用 来 访问 TLB 的 虚拟 地 址 的 组 成 部 分 


图 1017 (a) Rem T S TLE 命中 时 (通常 情况 所 包括 的 步 又 。 这 里 的 关键 点 是 ， 所 有 的 地 址 
ЫЕ ДЕ: MMU 上 执行 的 ， 因 此 非常 快 。 

€ 各 一 步 ， CPU 产生 -个 虚拟 地 址 

e GS dE 0. MMU M TLB 中 取出 相应 的 PTE. 

* X9. MMU 将 交 个 虚拟 地 址 翻译 成 一 个 物理 地 址 ， 并 且 将 和 它 发 送 到 局 速 绥 存 / 主 存 。 

e RET: 向 速 缓存 / 主 存 将 所 请 求 的 数据 字 返 回 给 СРО, 

A ТІВ тти, ММО 必须 从 Ll 缓存 中 取出 相应 的 PTE， 如 图 10.17 (b) 所 示 。 新 取出 的 
PTE 存放 在 TLB 中 ， 可 能 会 覆盖 一 个 口 经 存在 的 条 目 。 





(a) ТІҢ 命中 
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(b) TLB 不 命中 
图 10.17 TLB 命中 和 不 命中 的 操作 视图 


10,5. “АЖ 

ЗІҢ, 我 们 一 直 假 设 系 统 只 用 一 个 单独 的 页 表 来 进行 地 址 番 洋 。 但 是 如 果 我 们 有 一 个 32 
位 的 地 址 空间 、4KB 的 页 面 和 一 个 4 字 节 的 PTE， 那 么 我 们 总 是 需要 一 个 4MB КЛ ЖЕЙ ЛЕ 
器 中 ， 即 使 应 用 所 引用 的 只 是 虚拟 地 址 空间 中 很 小 的 一 部 分 。 对 于 地 址 空间 为 64 位 的 系统 来 说 ， 问 
题 将 变 得 更 复杂 。 

用 来 睦 缩 页 才 的 常用 方法 是 使 用 层次 结构 的 页 表 。 我 们 使 用 一 个 具体 的 示例 来 如 潍 你 对 这 种 方 
法 的 理解 ， 假 设 32 不 虚 拟 地 址 空间 被 分 为 АКВ 的 页 ， 而 每 个 页 表 条 习 部 是 4 宇 节 。 还 假设 在 过 一 
ME), ЖИДЕШ ЕН АШ FEX. 存储 器 的 头 2K 个 页 面 分 配给 了 代码 和 数据 ， 接 下 来 的 6K TOL 
还 未 分 配 ， 肯 接 下 来 的 1 023 个 页 面 也 未 分 配 ， 接 下 来 的 1 个 贡 面 分 配给 了 了 用户 栈 。 图 10.18 展示 
了 我 们 如 何 为 这 个 虚拟 地 址 空间 构造 一 个 两 级 的 页 表层 次 结构 。 

一 级 页 表 中 的 每 个 PTE 负责 映射 虚拟 地 址 空间 中 一 -个 AMB 的 组 所 (chunk)， 这 里 每 个 组 块 都 
是 由 1 024 个 连续 的 页 面 组 成 的 。 比 恕 ，PTE ОВ — ik, PTE1 上 耽 射 接 下 来 的 -组 块 ， 以 此 
ЗЕ. 1 НАЕ 09) AGB. 1024 PTE EE LAE ERR Г. 

MRH i 中 的 每 个 页 面 都 未 被 分 配 ， 那 么 一 级 PTE i ША. ЯШ, P 10.18 +, HH 2—7 
在 未 被 分 配 有 的 。 然 而 ， 如 果 在 组 块 1 中 至 少 有 一 个 页 是 分 配 了 的 ， 那 么 一 级 PTE iMi- -个 二 级 
页 表 的 基 址 。 例 如 ， 如 图 10.18 Pros, 490. 1 18 的 所 有 或 者 部 分 已 被 分 配 ， 所 以 它们 的 :级 
PTE кїїнїн] RD. 

二 级 页 表 中 的 每 个 PTE 都 免责 映射 - -个 4KB 的 虚拟 存 情 器 页 面 ， 就 像 我 们 但 看 只 有 一 级 的 页 
表 一 样 。 注意 ， 使 用 4 字 节 的 PTE, 每 个 一 级 和 二 级 页 表 都 是 AKB 字 节 ， 这 刚好 和 一 个 页 面 的 大 小 
是 BEN. 

这 种 方法 从 丙 个 方面 减少 了 存储 器 槛 求 。 第 一 ， 恕 果 一 级 页 表 中 的 一 个 PTE 是 空 的 ， 那么 相应 
的 二 级 贡 表 就 根本 不 会 存在 。 这 表现 出 一 种 三 大 的 洪 在 节约 ， 因 为 对 于 一 个 典型 的 程序 ，4OB 的 虚 
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МЕНЕЕ ЛЕК УРАНУ. $—. НАДАЛА P. SWT Ж 
(ELSE. АШИ Add CEDE. ИМРОН. АНЕ # Ж ТЕНИ 
HACER HET, 


ЕМЕНІ ТКЕН 
кй vM s 


6K TEHE ҰМ 而 


Шз 个 来 分 配 的 页 





ІЖЕЗМЕІНЛІШІІ ҰМ I 


图 10.18 —TrTHRESEXGEN 
EREHE Ti: F 56), 


ЇН 10.19 fik T Ië B] КИ ЕКЕ ЕНІНЕН, HH E oS k + VPN Ri | + УРО. 
ET VPN А ТЗ ЕВ, ДА, WE; mST PTE, 1</<і-І1. 
iig uersu. mrs ЖР PTE 手包 音 基 小 物理 页 而 的 PPN， 或 者 一 
TEERAA 5) TARAA EERE PPN 之前，MMU 必须 访问 上 个 FTE。 对 于 内 有 

ЙИ ЖЕНШ. PPO 和 WPO 是 相同 的 ， 








10.17 # FU #& ИШАНИ 


BERE 611 


访问 天 个 PTE, Ж 86 Е AmA. AAT. 8 TLB EREA. EERIK DU 
中 不 问 层次 上 的 PTE ЕЖ. ЖР. PRENIAN ЛЕТІН Ж. 


1064 综合 : Patne 

i3x— 59, $48 —- Hm Sp T HR RAI, ERIT КЕЛІНІ ЕРІ, 
这 个 示例 运行 在 有 一 个 TLB 和 Ll d-cache BE E. T kur ni Pr lPk, Seb F BW: 

. ЫТТЫ. 

4 duet 1 字 节 的 字 的 (不 是 4 字 节 的 字 》。 

. 虚拟 地 址 是 14 位 长 的 (л=14), 

e WEHE 12 位 长 的 Ст=12). 

e DIR АМЕ 64 + (Р=64). 

• TLE 是 四 路 组 机 联 的， 总 共有 16 个 条 日 。 

s LI d-cache 是 物理 寻 址 、 直 接 映射 的 ， 行 大 小 为 4 字 节 ， 击 总 共有 16 A. 

图 10.20 展示 了 虚拟 地 址 和 物理 地 址 的 烙 式 。 因 为 每 个 页 面 是 2*=64 字 节 ， 所 以 虚拟 地 址 和 物理 
地 址 的 低 6 位 分 别 作为 VYPO 和 PPO。 虚 氛 邮 址 的 高 8 位 作为 YPN。 物 理 地 地 的 高 6 位 作为 PPN. 


13 12 11 1й g B ? 6 5 4 3 2 1 Ü 


“ттт 


+ — VPN МРО —— > 


(EHLE) CEL H f ERO 





e Саа 


4 一 一 PRN 一 一 一 一 一 一 一 PPO 一 一 一 
《物理 页 号 ) СЕМЕ) 


图 19.20 ”小 存储 器 系统 的 每 址 
Б 和 位 的 万 执 地 址 Coz14), 12 РЕТТЕ НЬ ВЕ m=12) 3164 SE БИДЕ CP. 


Pd 10.21 展示 了 我 们 小 存 情 器 系 统 的 一 个 快照 ， 包 括 TLB “a}、 页 表 的 一 部 分 (b) AL 高速 
HT (с). Æ TLE НАЖИ ЕШ. 我 们 还 展示 了 访问 这 些 设备 的 硬性 是 如 何 划分 虚 所 地址 
和 物理 地 址 的 位 的 。 


*——— ТВТ 


31211 10 3 à 7 8 5 4 3 2 1 0 





RB TOR HE 


4 — ——— VPN ————— < үр —— 


( re PPN — 标记 位 PPN {айу nudis PPM КЖ 标记 位 PPN ЖШ 





(a) TEB: WH. 16 +£ H. ПИШЕ 
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VPN PPN АЕ VPN PPN ЖЫ 





(b) G4 ИВ T 16 T PTE 





ст ——— t — C0 — 








PPN —— a PPO — ——* 


索引 标记 位 3 йй БІ x2 X3 





FEM ol -| -| - 
(с) Sfr: 16 СҢ, PUER. НЕМ 


10.21 З ТВ. М ЕЕ 
ТІВ. ТА КИНАЯЛЕ ЛЕН АНЫ. 


* ТІВ. ТІВ 是 利用 VPN 的 个 进行 虚 民 村 址 的 。 因 为 TLB 有 由 个 组 ， 所 以 VPN РИКА 
作为 组 索引 《TLBI)。VPN 中 剩 下 的 钢 和 位 作为 标记 〔〈TLBT)， 用 来 区 者 可 能 映射 乔 同 ` 
个 TLB 组 的 相同 的 VPN. 

"AR. 这 个 页 表 是 一 个 单 级 设计 ， 一 共有 2=256 个 页 表 条 日 (PTE)。 然 而 ， 我 们 只 对 这 些 
条 日 中 的 开头 16 个 感 兴趣 。 为 方便， 我 作用 索引 它 的 VPN 来 标识 每 个 PTE: (ERE Sc 
(ЕЕ VPN ЖЕЛ ERN -部 分 ， 也 不 储存 在 存储 器 中 。 另 外 , 注意 每 个 无 效 PTE 的 PPN 
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ABI ETESXXCR. ГА: ЭЛЕН ТИІН ЖЕДІМ, WEHE 
IPE X BJ. 

. Ж. АЖЕН RRT S ih hhi УТЕ ЖАН. AARTE 4 5, ЖИ 
ИТИ НАЛ BU 2 EA BRE (CO). МАЯ 163, PEULEE F KB 4 МАН ЖАН ӨЗІ 
CCI)。 剩 下 的 6 位 作为 标记 (CT)。 

给 定 了 这 种 初始 化 设 定 ， 让 我 们 来 看 看 当 CPU 执行 一 条 诺 地 址 0х0394 处 字 节 的 加 载 指 令 时 ， 
会 发 生 什 么 。( 回 想 一 下 我 们 假定 CPUS 1 FERUZ, 而 不 是 4 字 节 的 字 。)》 为 了 开始 这 种 手工 的 
模拟 ， 我 们 友 现 写 下 虚拟 地 址 的 位 表示 ， 标 识 出 我 们 会 党 要 的 各 种 字段 ， 并 确定 它们 的 16 进 制 值 ， 
是 非常 有 帮助 的 。 当 硬件 解码 地 址 时 ， 它 也 执行 相似 的 任务 。 





开始 时 ，MMU A RETUUNICRE rh VEN LO0x0F)， 并 且 检 查 TLB 看 它 是 否 因 为 前 面 的 菜 个 存 
iau Hj RE 7 PTEOXOF 的 一 个 指 贝 ,TLB 从 VPN 中 抽取 出 TLB 索引 Ox03} 和 LB 标记 {0x3)， 
组 0х3 的 第 一 个 条 日 中 有 效 位 此 配 ， 所 以 命中， 然后 将 缓存 的 PPN (0x0D) 返回 给 MMU. 

如 果 TLB 不 命中 ， 那 么 MMU 就 需要 从 主 存 中 取出 相应 的 PTE。 然 而 ， 在 这 里 的 情况 中 ， 我 们 
RFE, ТВ 会 命中 。 现 在 , MMU 有 了 形成 物理 地 址 所 需要 的 所 有 东西 。 它 道 过 将 来 自 ETE 的 PPN 

(0х0р) ЖЖ ЛИНЕН УРО (0x14) 连接 起 来 ， 这 就 形成 了 物理 地 址 (Ox354)。 

E PX. MMU ЖОН, APARE P РІНЕ СО (0х0), SH 

5| CI (0х5› 以 及 缓存 标记 CT (Dx0D)。 


PUE ЕСЕ 
mx пареа ере DIS KI 
Pasossa o [o [T DE [9 1i [9 [119 [19 [01 
вво 


PPN 


TT 


因为 组 0x5 中 的 标记 与 СТА, ЭТЕ ЕТЕН ат, Wii iS СОЛЫ 
F 《0x36)， 并 将 它 返 回 给 MMU， 随 后 MMU 将 它 传 递 回 CPU. 

ШЕШН РН ШЛНДЕ Н. ИШ, ШЯ TLB Tit, WA MMU 必须 从 页 老 中 的 PTE 
中 取出 PPN。 如 果 得 到 的 PTE 是 无 效 的 ， 邦 么 就 产生 一 个 缺 页， 内 核 必 上策 调 入 合适 的 页 面 ， 重 新 运 
行 这 条 加 载 指令 。 另 一 -种 可 能 性 是 PTE 是 肥效 的 ， 但 是 所 需要 的 存储 器 块 在 缓存 中 不 命中 。 


练习 是 10.4 
3,8] 10.6.4 节 中 的 示例 存 情 器 系统 是 如 何 将 一 个 康 拟 地 址 翻译 虑 一 个 物理 如 赴 ， 以 及 访问 组 
В. 对 于 给 定 的 虚拟 地址 ， 指 明 访问 的 TLB 素 目 、 物 理 地 址 和 返回 的 缓存 字 节 值 ， 指 出 是 否 发 
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生 了 TLB 不 命 中 ， 是 否 发 生 了 缺 页 ， 以 及 是 否 发 生 了 缓 硅 不 命中 。 RARETAT, Æ “RN 
HATT” ЕФІЕА 5”, jo Riku, БЖ “PPN” 一 栏 申 输入 “-”， 并 且 空 着 СӘ р 
部 分 ， 

mis 0x03d7 

А. 虚拟 地 址 格式 


з 12 H о 9 8 л 6 5 4 3 2 | 0 
B. 地址 翻译 












а 
Е 
mai БЕНЕН 
пзе ую | 
эшо | 
m- jj 


C. AE ELA < 


ҰРЫ 


D. HEARS fH 


ЕЛГЕН БЕНЕН 
[wm — | — 
ССИ И 
redran PH? CYN) Е 

EN 












JR nim ЖТ ТІ 


107 ЖИЯР: Pentium/Linux 存 久 器 系统 


我 们 以 ”个 实际 系统 的 案例 研究 来 概括 我 们 对 缓存 和 虚拟 存储 器 的 讨论 , 选 几 的 系统 是 Pentium 
类 的 系统 ， 运 行 的 是 Linux. Е 10.22 给 出 了 Pentium FRR 3: 96 Ë 80877. Pentium 系统 有 一 个 
32 位 (46B) 的 地 址 空间 。 处 理 器 组 件 (processor package) 包括 CPU 芯片 、 一 个 统一 的 L2 НИЯ 
AUERIMER ET Ran sk (WARS), CPU 芯片 适当 地 包含 了 四 个 相同 风 组 存 ， 一 个 
指令 TLB、 数 据 TLB、L1 i-cache 以 及 Li d-cache. TLB 是 虚拟 寻 址 的 。L1 Ж112 缓存 是 物理 寻 址 
ІМ. Pentium "УТЕ ЕТ СЫЗА TLE) 部 是 四 路 组 相 联 的 。 
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3 «um 
4KB 的 页 大 小 
11. L2 Ñi TLB 
. AETHERE 
外 部 TD ift 指令 TLE 
p pn — ` < mH. ва 
L? ; ER TLE 
Bi : . 他 个 条 目 ，]5 组 
: LJ i-cache 和 d-cache 
ЕГ РЕ ` e 16KB. 128% 


一 一 一 + 一 一 | . 32B 的 块 大 小 
| ja E REL 1] 单元 PLI ЕЗ 
; е 统一 的 
|. 128КВ—2МВ 
ек | 


п 
aa 'munzuzunmuir una ни лин иннии иин иишиишшп.интиндинигтгин LE гин NENNE гич ип нич UR TROC ич чч виа Фри рии пиип.рулиишишиишиьишьин ER I ERERTERCERTRTET ERN 


ЖЖ ЕНЕ 





Ра 10,22 Pentium FRAAS 


TLB 缓存 32 fL WERE H. 指令 TLB 缓存 取 指 单元 产生 汐 虚 扳 地 址 的 PTE, 数据 TLE 缓存 数 
据 的 虚拟 地 址 的 PTE. 指令 TLB 有 32 £ H, 数据 TLB 有 媳 个 条 日 。 页 面 大 小 可 以 在 局 动 时 配 
ЖЕНУ 4KB BEY AMB. EITE Pentium 上 的 Linux 使 用 4KB 的 页 面 。 

LI L2 高 速 刀 存 的 块 大 小 为 32 字 节 。 每 个 1 高 速 缓存 的 大 小 是 16KB， 有 128 个 组 ， 其 中 
每 个 组 部 包含 4 行 , L2 疡 巡 缉 存 的 大 小 可 以 在 最 小 值 128KB 到 最 大 值 2MB 之 间 变 化 。 典 型 的 大 小 
是 512КВ. 


10.7.1 Pentium 地 址 翻译 
这 一 节 讨 论 Pentium 系统 上 的 地 址 翻译 过 程 。 图 10.23 描述 了 整个 过 程 ， 从 CPU 产生 虚拟 地 址 
时 ， 直 到 数据 字 从 存储 器 到 达 ， 以 供 你 参考 。 


Sx. КЕҢІНЕН | | 

Ed ЖАН ЕР. ANERE AERA SEE IE, ИХ MMU XA Ў 
Abb AAA ЛЕ ЫЫ, КЕЕ АЫ НИН LI Жамб. Аа, EINE XS34mT—4X 
5064, ХИНИ ЎИЗ ER. Ид, Та 11 ARRANA, 

Pi, Ф АКВ 页 面前 Pentium Ж EH —4- AR Bed 12 48 УРО, JH Ri AERE dH И ME 
地 址 中 的 РРО 的 12 4E dal] 6. ЮН. АТ GRAECA 128 个 组 和 32 3 
ys, S MERE 54- Сор2) MARHE 7 + (log, 128) ЖЗ. ан 
Д8 ЖЫЕН) VPO Ap. KAKA KM I E CPU 需要 翻译 一 个 虚拟 地 址 时 ， 它 就 发 送 VPN 到 
MMU， 发 送 УРО Sl dk L1 4&5. 5 MMU 向 TLB GERE LR EE NS. 11 ñiki ñit Я) 
УРО 位 查找 相应 的 组, 并 读 出 这 个 租 里 的 四 个 炉 记 和 相应 的 数据 字 ， 当 MMU А ТІВ 得 到 PPN H, 
HECERA авах PPN 与 该 苯 小 标记 中 的 一 个 进行 营 配 了 ， 
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HIET T) ДЖ, X [Intel ИТИНЕ ЖАНАЕВ ТАЯТ ЙЫ. 
^. TRASMBSA ndis, таАНПЯН АЯНЫ, 





图 10,23 Pentium Sh IHE CHEER: 


Pentium U 8 
h^ Pentium RAMENE 1024 И Е, mn. ШИЛЕНЯ (pape 
directory), fuo 1024 4324908 PDE (page directory entry, ADARRA ИРЕ H Ж 
向 1024 4 2 SR Lr P] s SET ДЕШ 1034 4 32411 PTE СИЗЕ Н, Др + НН 
НТ ЕЕЕ ЖШ bh—Tmm. 
Ж 


1024 PTEs | #&0 





| 1024 PTES | AE 1 


(РСЕ) | — 
1024 PTEs | ЕЖ 1023 


1024 Pentium I| & £L BER 
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每 个 进程 都 有 一 个 惟一 的 页 面目 录 和 页 表 和 集合。 当 一 个 Linux 进程 正在 运行 时 ， 足 管 Pentium 
的 体系 结构 允许 页 表 换 进 换 出 ， 但 是 页 吉日 录 和 与 已 分 配 页 面相 关 的 页 表 都 是 常 驻 存储 器 的 。 页 面 
目录 基 址 寄存 器 〔page directory base register, РОВА) 指向 页 表 目 录 的 起 始 位 置 。 

图 10.25 (a) 展示 了 PDE 的 格式 。 当 P=1 时 (Linux 中 总 是 这 样 的 )， 地 址 字段 中 包含 一 个 20 
位 的 物理 页 号 ， 指 向 相应 的 页 表 的 起 始 位 置 。 福 意 ， 这 要 求 页 束 肥 АКВ HA. 

图 10.25 (b) 展示 了 PTE 的 格式 ， 当 p=] 时 ， 地 址 字段 包含 一 个 20 位 的 物理 页 号 ， 指 向 物理 
存储 器 中 某 个 页 的 基 址 。 同 样 ， 这 也 要 求 物 理 页 要 4KB HA. 
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11 9 B 7 B 5 4 3 2 1 Ü 
een [жя | s [m] [л Го Гат vs [wl 
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页 各 存在 于 物理 存储 器 中 〈1) 或 者 不 存在 《0) 
Rises ES iE 

H Padum Hi PRSE CABRIO 访问 许可 
AD P SCRIP ES d ЧЕН 
Hir (1) 或 者 启用 (0) 


KARENS? (在读 写 时 由 MMU 设 置 ， 由 软件 清除 ) 
ЕКА АКВ (0) 或 者 4MB (1) 

全 局 页面 【在 性 务 切换 时 ， 永 会 从 TLB 中 报 除 掉 ) 
物理 页 下地 址 的 最 高 30 位 





(a) MIES £B (PDE) 


操作 系统 可 用 的 〈 在 二 象 存储 中 的 页 面 位 置 ) 


页 表 存在 于 物理 存 情 器 中 《1) 或 者 不 存在 〈0) 
Ий ЖЕГЕ ШЕН 

ДЕ ЖАЙНА А [内 核 模式 ) 访问 许可 
对 这 个 页 表 的 直 写 戌 者 写 回 缓存 策略 

BFE (1) ЖЕНШ (0) 

引用 位 AMMU Ж ЕНЕ, ШКЕ) 
ШЕШІ (НІММІНЕЕІНІЕЕ., mittes 
dE GERA EIS АТВ) 
PH do ЕНЕМЕ 205 





(b) HEH (PTE) 
10.25 Pentium 页 面目 录 条 目 【PDE) 和 页 表 条 目 (PTE) 的 格式 
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РТЕ 有 两 个 许可 性 ， 朋 来 控制 对 这 个 页 面 的 访问 。RJW eb OE Ер E, 
EREN Us 位 ,确定 是 天 可 以 在 用 户 模式 下 访问 这 沾 页 面 ， 这 就 保护 了 操作 系 旦 内核 中 的 并 
BIETET dE m FH ТЕН E 38 , 

ПЁ MMU iiS RU GE FE. ЕШ ИЛ BES. NES TRE 6 
ИША. 每 次 请 问 一 个 页 面 时 ，MMU SRE IS А 07, de BET] IRE (reference bit), НЫЛ | 
Hi oC ДАЕ RO CBE BER NETS. ШКЫН. MMU 就 设置 D ty, miaka (ашу bit). - 
TU Ж eT GR E TRAE HE eR ИЕ & (ашу page). ЖОП TIENE TE ER А — AW 
MH. ЖИРЕН НИШ. ARTAN- WI P E ШІН kika at ЖШН. 
35. ТҮГЕ ИХ НЕ ) 

8%. Pentium ЖАН Ert TE, ДАНИРА Г АА. Ш 


T Edi sn Tt AG. АЛРАН ЬИР (3.13 30. pA ЕН AM GS 
B. Жанек Н REREH, ЖАА AUR T. 


Pentium НІН 

ІҢ 10.26 展示 了 Pentium MMU WA fe E] Hi dg VE, #—1 dH b S CE HCM EHI. 200 位 的 
VPN КӘНЕ 2 + 10 {# Ж. VPNT 在 PDBR 指向 的 页 目录 中 索引 一 个 PDE. PDE 中 的 地 址 指向 
ніні Ж. VPN2 索引 的 PTE 中 的 PPN 和 VPO 连接 起 来 形成 了 物理 是 











$m Hx Hh ЖЕ) 


| | ТТА 
таеш ТАБЕ Р? 


EI LI 





ТТТ" 
зен 





Ж 10.22 Pentium FREE 


Pentium ТІНІН 
ІҢ 10.27 ЖЕ Т Pentium 系统 中 TLB 翻译 的 过 程 ， 如 果 PTE ННІ TLBI 党 引 的 组 里 【TLB 


khas | _619 


= 





ігі, ЖАКЕН PTE 中 抽取 出 PPN, ЖЕШ PPN 和 VPO 连接 起 来 形成 物理 地 址 。 
WROTE PTE, BERT PDE (4 TLB dieto, 3:5 MMU £a ERE: W. 
ААМИН PTE, REIS, ШЙ PDE 和 PTE ЖЕШ CTLB deb, Ж, MMU 必 
ЖА fef ТИН PDE 和 FIE， 以 形成 物理 地 址 。 





图 10.27 Pentium TLB НЕ 


10.72 Linux ЁН Ж 

РЕН Ин ЖК ЖЕНЕ А ЕУ D] CREE, ЖЕЕ ШЕШН T ded1id 
论 的 范围 ， 在 这 一 小 节 中 我 们 的 目标 是 对 Linux 的 虚拟 存储 器 系 崇 做 一 个 描述 ， tb PRESE X STE 
ЖЕЕ bm rig S dE E DLE On fo НЕН, 

Linux 为 母 个 进程 仅 持 了 一 个 单独 的 虚拟 地 址 空间 ,形式 如 图 10.28 Po ЖЕЕ ЕКИ 
ША Т, {ДЕ НЕЦ, EUR. ш. TOES ABI. КТЕ ЖЕ h ik, 
ЮПЕНЕНАЕФМХТАН ИЯЫВЕЯНТ, RA n LEE ЕДІ ЕН} Oreo ию 
I. 

КИЙНИНЕ АБРЕК РАТИТЕ" 
Hem ЕШ. fü, ЕЖЕ КОЕ А HORT CIAO IR GEEK. ЖІБІН, Linux {б #—#{ nt 8 
BERURE (大 小 等 于 系统 中 DRAM 的 总 量 ) КЕҢИ Ii f Е НАР ГЕ. wA A HLI T 

-种 便利 的 方法 ， 素 访问 物理 存储器 中 任何 特定 的 位 置 ， 例 如 ， 当 书 湖 要 在 一 些 设 备 上 执行 存储 器 
BEI DO ЖЕН. ТИПА d Hp RUM Р КИЛЕШ Ж. 

з КЕЛГИ ГЫ {КЫ SAH BMN. БИЕШ. НЕТИ ВА ЕЕ 
ка ы D RRRA aa ЕП ТЕЛДЕ РИ 

Linux EE £z fr ХМ 

Linux НЕН — AI 3% (bm И) eA. — FB (аға) ЕРЕН 在 着 的 

“记分 本 的 + ЖҮН ЕТЕНЕ (chunk), НЕКЕ ЕЛИ ЛИЛ CAD EIN. (8 
m, ТЕН, ЖШ. HE. Мк, DEP H NE TEJA. ЖЕКЕШЕЛІК ЛЕ 
MAX Men, їй ЩТ CT D c 9 Y HE HIER. НАИ Н. ҚЫН, 

W AE fe rH HR Е чо НН. PCIE па AEG IE M RUE Ifi x FF ER] UR dii tB uh HL fp ilh 
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„л... (Mim, UD. ша 和 
men Mg. JN W b) 
s Fip ER Lu Н 
жшн 
E-i 


ME ае аа) 


нит 


图 1028 —-f Linux ЖЕЕ ta 3 

图 10.29 ЖШ Га Тән ЖҮР ЖАН КЕЖЕ. ӘНЕ ЕРЕН 
ЕР ARREA (КЕН task. ыла). ES rp n sce e e HR GE F1 iR 
进程 也 需要 的 证 有 信息 CIN BI, PD. eI PE. qi] ET. LL ERIT 
B». 

task. struct 中 的 一 个 条目 指向 mm, struct. CET ШРЫ ЛҮ Ж. BIN pr) E 
FELE pgd 和 ттар. Ж ped fils W ñ H RAE D HERE. ii ттар 指 同一 个 vm area, structs. C[X Bf 
SEED WWM, Hiii vm area, structs БНЕТ НІНЕ І-ІІ (area), НЕ 
TATE. EAH ped 存放 在 PDBR БІЗІ. 

ЗІНІШПЕНІ, АЗЕ ЫЕ а (vm area struct? 也 井下 十 的 字段 : 

е vm sari: TEES TI SERT do а, 

* wm end: ЎНГ ААТА, 

* wm port 描述 让 个 区 域 肉 包 音 的 所 有 页 面 的 读 写 许可 权限 。 

* vm flags; 描述 这 个 区 域内 的 页 面 是 否 是 与 其 他 进程 共享 的 ， 还 是 这 个 进程 匆 有 的 【还 搬 述 

ГИА). 
* wm next: Е ЕЦ, 
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图 |02% Linux ЖШПЕН gr o ЖЕН 


Linux ДЕҢ НЕГР 

БІЗ ММО БАНИ ТШШН АН. MUR T ВА. dT Pg FEREBAT ER IE) 
ӘЛДЕНЕГЕ, ЛЕВЕ РЕГЕ BR ES ЧАТ КЕШЕ. 

|. ШАШ A 是 音 法 的 吗 ? НЕ. A EMT X bo KG (vm, area struct) 3E X ЖЛ N 837 
ATTERRA, SALE ЕШ КЕННЕ. JE A Hj BEES jich үп stam 和 和 
vm end WER. Ang Td B HEB, JAM ТА РЕ РЕА НАЕ, АШ ЕД 
W. ТИЧЕ ТЕВЕ 10:30 Hai “1”, 

E — T ERI ар @ {ЕЖЕТ НІН ЕН (ИНК F wn IE] nmap Ж). HW 
ELMCT MER ЕЕ. e tu Ez. ЧЕЧ, ЖЖ odi S ih hO yB 
Linus ЕЕЕ Т EH. Ta misis ыінтен. 

2 WS FERME Н ЕРІНЕ ШЕН. A MESE eR uH CRI TENA 
Ш? pan. ЈАЛТА ЈАН REAPER ACT PCILBE E E] FL Ue E TG ETT S ME HE 7 E Bd i ui 
ДЕА ДЕ Ч 5 — tE HBP АЗ Ж А IA, Pa pcd fU E hEn 1 ШЕМ 
Bis ir nre НЕН, ШАЛАК ЕТЕ ARMED КЕРІ. Мий ЕТА. ам 
在 图 10.30 申 标识 为 *2", 
| 3 ЖЫ. НЕШ Tix R Hi ТАГЕЗЕРИЕННІНІНІТ ЕНЕ, САҢ N 
Vg. ШЕН ТӨЛІНЕН, ЖАЙЫН, ВАШЕШ. ЖӨНІ», ШІ 
HARRI. "ШИРЕНИ. CPU XN HIR KI, AE А 到 
MMU. 这 一 回 ，MMU SE REIE CHEER A， 而 不 要 再 产生 ТУ OPE T. 
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yn irei sEruct i — 
| 
| š Т) ХИР: 
ча апа | ”访问 一 个 不 看 在 的 页面 
| | @ явя 
Sem, 


, Bun. Wit, 
РТО 





10.30 Linux Аа 


10.8 ”存储 器 映射 

Linux 【以 及 其 他 一 些 形式 的 Unix) ilit НОРВИЧ (ohjeci) 
ARREK ШНА dU EM SIE EA TE. ХЛИ БШ A Eski (memory mapping), 
dri (rh REX b np UL ge 8 mI EL HA RERR : 

l. Unix ҰРҒАН p ou e. P MO DD M B — 7 Pel a Xt Ci m p np fg H ds 
кір ЮЖ ЫЛ. ХЕ ЕЛЕШЕ KH. @—Н%—1ДИШИ ORG RS НІНЕН 
H ТШ. ИТЕШЕП ИШИ: УЕ А ИИ ТИЕ. BH R| CPU 第 一 次 引用 到 页 面 ( 也 就 
是 ， 晕 射 一 个 虎 握 地 址 ， 斑 在 地 址 空间 这 个 页 面 的 范围 立 内 7， 如 时 区 域 比 玄 忻 的 这 部 分 要 天 一 些 ， 
ТАЯНА EXPE FEN, 

2 R£ tj. хао AI— TERT EP TE EH SI DES), RT TR 
CHMP. СРО 9 — УТА ВИН, HES bH IE ERU DIEI T 5i 
НӘН ТІ, inc UH] MERIT. Wir i undi. Е И НАЕТ, ЖЕШ 
&. ui TE АЖЕН И ЕЛАН РЇ. ИЖЕШаНЦТИВОИНЛОЯШ іне. 
[HIR TRIN. PHARES РЕВО МЕН Т. dp] dro Н Eg N Cdemand-zero 

ЖЕТЕЕР НП, ШИ Phi T, ERE- TAARE EAA 
(swap file) flo x. TREENAA E (swap space) SEE Ў ЗА MI (swap агеа). 
BERRAR- AE, ЕНІНЕН. Ж ЕЗ ИЕЫ МА E ТТ ил MERE ЕЛЕ CI 
页面 的 总 数 ， 





| | BAS 623 
= — ТЫНЫ... И 
1081 再 看 共享 对 象 

FEARS с CURE T — 1 а ИТ Ip PER AR, 
MARERE- Bh IE m DO dms PURO E IRE In RB itu hii, 

ЕШТЕН. d$ — Y ЕДИ РИНЕ CORSA P dri Hb esf]. u 以 好受 
其 他 进程 的 错误 读 写 ， 不 过 ， 许 才 进 程 有 同样 的 只 读 文 二 区 域 。 例 如 ， 握 沾 运行 Uni shell Fi P tesh 
МНЕ ЕНИН ЖЫ. 而且， IPP И HL eie fri КЕНГЕ UD. din, S 
C RUF RUE OR ПНЕ C 库 的 诸如 prim IE EISE. ЖА. ШШЕН ЕЕЕ ШЫ 
iw HI pli. Wax ЖЕЕП Т. HERUR, {Жж k JH Т — ihi i) 
HIM. ЖЕНЕ THERE $8. 

—TH$a LK e BIB EM. PEN ERES, * TENA HA. ШШ 
TRER T Hoc ЕНЕНЕ n dieit Hp hic fig — MC bg. EA CP aA RE 
Hit. ГТ ЖЕҢЕ ААЛИ ИНЕ ЕПШШ ИШЕ ЕЕ. tarum. mH. 
A E AUR dod rid i8] S ІР. 

太一 方向 ， 对 于 一 个 号 射 到 私有 对 象 的 区 域 做 的 改变， 对 于 其 他 和 过程 来 说 是 平 可 见 的 ， 井 且 进 
BO ix^ S Re Me EE RUE Е e Re rc PE IHE GA ЕН BUB PI, HO (E (RE 
PRI X ER, RN, БЫ. 

ERNE 1 ЯЕ EXE RES EA RU M didt fe B — СВА Е, ШИ 1031 (а) Жж. НЕ 
КЕЛЕ 2 li| — Fit ЖК ИТЕ PO HA BS рар [ ra — i ЕНЕН EcL i b Ж. іп 
图 10.31 Ch) Bra]. 






HEB 1 w iM EE. 进程 1 的 юн &P 2 的 
ARUME тив sSUhkA  ® тив актин 
X N 
қ D 
k: x 
ç ` 
k ` 
N 
` 
кен 
ГЕ 


图 10.31 6 
(a) 进程 1 酸 射 了 其 享 对 象 之 再 ;tb ШЕТ ТЕНЕ. TEBRWS SIE F E E: Bikikh у 


ЖЕТИ а kit, МНЕ Fs HERE 1 СЕН ГЕТЕ. mA 
"ПЕН 2 hii ЕЕ H fit SL AME SEE NI, ЖЕРШЕ MERE PL Т eH HC CAR, 
物理 存 情 器 中 也 只 需要 存放 共享 对 象 的 一 沾 拷贝 。 为 了 衣 恒 ， 我 们 将 物理 页 面 显示 为 连续 的 ， 得 是 
fr Bl Fo Ex. 
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{ГИ 9 EIER] —Е# k Sahi H (сору-оп-атие) МІРІ ЖЕНЕШЕ О, — 
ЗЕН UE dr ДИДИ Ж ESR 390 pi, ЖЕШ ЕН Б ЕЛ OD 
HHM. Him. Жо (а) MOST WR. КРЕТ m RC M n I FL 
BINE, FR GERE T B II — HA ERE UL. э ТВИН Ей ЕШР. HEEE аг БСМ 
ЕФ Ele Ld, ER CM ER EE UU ROC ИЕП. ПИШИТЕ: BO 
的 私有 区 域 ， 它 们 就 可 以 炙 持 共享 物理 存储 加 中 对 急 的 一 个 单 钉 拷贝 。 航 而 ， 只 更 有 一 个 进程 试图 
写 私有 区 域内 的 某 个 页 面 ， 那 粤 这 个 写 括 作 就 会 节 爱 一 个 保护 故 随 ， 

当 散 庚 处 理 各 序 注 意 到 保护 异常 是 由 于 进程 试图 写 秘 有 的 写 时 拷贝 区 域 中 的 一 小 页 面 而 引起 
的 ， 它 就 全 在 物理 存储 器 中 创建 这 个 页 面 的 一 个 新 捷 见 ， 更 新 页 表 条 日 指 向 这 沾 新 的 皇 见 ， 姑 后 
复 这 个 页 面 的 可 写 权限 ， 如 图 10.32 (b) 所 示 。 当 故障 处 章程 序 返回 时 ,CpU ЖЕНДИ ЛЫН. 
现在 在 新 创建 的 页 而 上 这 沾 写 六 作 就 可 以 正 党 执行 了 。 

通过 延迟 稚 有 对 旬 中 的 持 贝 直到 最 后 可 能 的 时 肇 , 写 时 振 贝 最 充分 地 司 用 了 本 有 的 物理 存储 器 。 








Шит тя 进程 2 的 进程 1 的 = "TIT 
dria қық кмш quum M Т на 


жат 
m! 
— t" 
М „= 
" 
1 ғ 
x LJ 
Г! 


А 

w 司 私有 的 如 

HE SL E 
À 





XT ДЕШ I 村 有 有 的 写 时 
IHR Р 


8810.32. 一 个 和 有 的 写 时 拷贝 对 铺 
шыра е Y WITNESS E. 00 HERI ТІГІЛГЕН ЕН 


1082 83 fork 函数 
қанатта ЗЕНОНА А Н, ЖО, LT CLR KE fork 函数 是 如 何 创建 一 个 
带 有 自己 独立 虚拟 地 址 空间 的 新 进程 的 。 

Pork 函数 室 雪 前 进程 调用 时 ,元 核 为 新 过 程 创建 各 种 数据 结构 ， 并 分 配给 它 一 个 惟一 的 PID， 
AT MATEERIA TAE. ЧЕШИ Т SiE mm suet, ТЕЗЕ НЕ (vm, area sinet} 
ROG IHE JL, eic Ae db ORE COR ЕЮ, ЖЕП IERI TRAE CLR 
Аг. 

-Si fork ЖЕШИН, git ER E f de ЕРНИ ЕНЕ RO А fork Е Ef) СЕЧЕ RR. 
“ЗА ЕЕ ILE i kiti MHEM, ЧЕНЕДИ ЕРИНЕ. DRE. Ua Arf 
BEHE T ACTOR ТТҰА 
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1083 Ж execve EN 

He FL (E ДЕ ОБ e HE CHER ЛЕВ Fe REF b COE RI ES БІНЕ 
HEGGA. ЕГЕН execve t CR Bep AEn inis rr FERA. siet ác it 
程 中 的 程序 执行 了 如下 的 ехесуе WH: 

Execveir*a.oOuE*', argv, eanvironi; 

execve 函数 在 当前 进程 中 加 载 并 运行 包 售 在 可 执行 目标 云 忻 out 中 的 程序 ， 用 aout 程序 有 效 
WERT SST. MEJASI алин ЖЕН ЕЛ, 

* 删除 已 入 在 的 用 户 区 域 。， 制 除 当前 进程 型 扫地 垣 的 用 户 帮 分 中 的 已 存在 的 区 域 半 村， 

. ARETE., AROF PIX. ЖЕ, bs 和 棉 区 域 创建 新 的 区 域 站 构 ， 所 有 这 些 新 的 区 
域 雷 是 秘 有 的 写 时 揪 贝 的 ， 训 本 和 数据 区 域 被 有 喘 射 为 a.out APAREA. bs 区 
域 是 请 求 二 进 制 零 的 ， 映 射 到 匿 和 文件， 其 大小 包 省 在 aou 中 , 栈 和 堆 区 域 也 是 请 求 二 进 
ШІ, ИШЕК АЖ. BH 1033 MES T ЖАПОН ARH. 

€ RARES. Ш aon 程序 与 共享 对 象 《或 目标 ) ӨНЕ, EEC B Ша, ЖАЗ 
ГЕ ЖИЕН БШЕК НЫ ЗЕТІН, КЕНШ SU] Ж ЕШШ sr fa] ТР Ер. 

e ЖЕЛИ КИ РС Lexecve 做 的 最 后 一 件 事情 就 是 设置 当前 进程 上 下 支 中 的 程序 计数 器 ， 
Wr d [ЧА п. 

FANTE. Р ААА СТ РАЗА ЯТ. Linux НЕ EE Re A (oom dc N. 















| нн |н. аята 
libc so LI Ho taksa 
Гама | Ааа қ - 
NE анын famn ЖИЕНІН 
ra ; ні > 1 Lu. n3 k 
ist H "uh 
CIE malloc HAER) fern ae м 
ш. 
NM i C bass) Әлен ux U Sx 
date БИШР ав г. дага? а AEN 
ira _ | н 
тис н | RH C секс) | i чан 
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10.84 ЧЕН ттар df B5 RP GRAm 
Unix 进程 可 以 使 用 mmap Е О EUER DC. PRESE IRE BECAS IE B 


ШЕ Л. 


білсішіп eunistd.hs 
ñincludë <яуя/памл.Һһ> 


void *nmapivoid *start, size t length, int prot, 
int flags, int fd, off t a£fIsat]: 


dm. Ж} Maita UAR, Fd 5-1. 





mmap BRE f Boer Е de ERA aq, БЛА start ЫТ. 
文件 描述 符 fa oE H6 — 6 Be ЕНЕ (chunk т АД РІНЕН, ЖЕ D HH (chunk) 
大 小 为 length ЗЕ, Makic PETER AE GE MER offset 字 节 的 地 方 开始 。stan ИЕ e — P8 

通常 被 定义 为 NULL。 为 了 我 们 的 目的 ， 我 们 总 是 假设 起 始 地 址 为 NULL。 图 1034 шетіне 


ТІНЕ Ж. 
y А | Lengthi f fr) 






4 D ў tàr: 
Length ¿3 W) Eu аа 
offset a е) 


ЕДЕ. 


LL ge 
TARE Ts fd ш 3E 
a e f МТМ 


图 10.34 ттар ma Wc 

ЕЖ pon Bud fie Be H ШШ fr f CAL URL PCR СЕЙ. ERBEN IX МН Т i] 
vm, port 27), 

* PROT EXEC; АЛМАН ИЯЛЫҚ CPU 执行 的 指 地 组 成 。 

* PROT READ: 这 个 区 域内 的 页 面 可 读 ， 

* PROT_WRITE: 这 个 区 域内 的 页 面 可 写 。 

e PROT_NONE: 这 个 区 域内 的 页 面 不 能 被 访问 ， 

Ж flags H1 BOE RET ЖЕЛІНІ. ШІ MAP. ANON ШИ. H H fd 为 NULL, 
日 各 校 贞 射 的 对 象 就 是 一 个 匿 省 对 龟 ， 而 相应 的 碟 拟 页 面 是 请 求 二 进 制 零 的 ，MAP_PRIVATE 表示 
如 映射 的 对 曾 是 一 个 秘 有 的 写 时 樟 贝 对象 ， 而 МАР SHARED dt — thyg. Bran 

Биёр = Mmap(NULL, size, PROT READ, МАР РЕТУАТЕ|МАР ANON, 0, D); 
iE PS CGU HE T BERI А size 宇 节 的 只 读 , EA. 请求 二 进 制 零 的 虚拟 存储 器 区 域 。 如 时 调用 上 成功 ， 
ДЕЛ, bufp HA A БЕ КН. 

munmap #8 ЖК r Ж Q М. 


EITT 





#include «uniatd.hs 
include <sšys/mman.hx 


int munmap[void *start, size г length]: 


iR. ғал» 0, ЖНННЯ-іІ, 


munmap (6 # ЖН H. qa at мап +. ҤЕ Ж length 字 节 姐 成 的 区 域 ， i£ F Е. 
[к ШЕШЕ НЕ. 


RENATO Lo prox map metere 
ih E —4- C 程序 mmapeopye， 使 用 mmap 4 — AEE X АНИ Я шш, OE. 
HERLAH фат ikita, 


10.9 动态 存储 器 分 配 
T fn ELE ЇЇ mmap 和 munmap i$ Xe] s ЕНІН EFR. EAEN cC AF 
М а а {ТЫ E, AARE ( dynamic memory allocator}. 
Та РВА А Lf m. [1051114 ME PL. (heap) (PH 1035). frc 
TJ Unix 系统 中 , 堆 是 一 个 请 求 二 进 制 零 的 区 域 , ТЕННЕЖІЕНІІҢ bes 区 域 局 开始 , ЕН [^E E: ІН 
到 高 的 地 址 )。 对 于 每 个 进程 ， 内 核准 护 着 一 个 变量 мк GEN “break "о. ЕЛІНЕН. 








— l SIE Cork ftbi 





ЖЕПЫНЕЗНЕ (ees) 


ЕГІ ТІР 


ІНЕНРНЕНД-НЯН Қ i block) HU cx. SPHERE TER HE ERE 
HR (chunk), WZ RE dE. 32 RES. PME Clock uL a ЖЕНЕН. Р 
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Жаа, СЗС ЕСЕ А РТ АЕ, СЕАТ regius. НЕКЕНІ, ik 
е Е ЕА 

ПРАСЕ ГН KLI. НЕҢЕШЕЖЫН Е ЖЛЕ. ЧРИ IRL ii ШИ ЕЕ 
XU E NW С АЕ АЈА, 

EAEE (explicit allocator) ЖЕН ЕСН ЕЛА {ЕИ Е АС Ж. МШ, C 标准 库 提 从 一 
种 是 向 malloc ferto do NH). C 程序 通过 调用 malloc ARRIE MB. ЙГЕ free 
ВАЕ Е IB. Сене 1 new 和 delete ВФЕ С.Я malloc 和 free 相当 ， 

AA GALE (implicit allocator), EAA. SER РАН НИЕ U E E BOR IB ERE e 
H, ЕТУ, ПОСЛА dm dr MDC ЖЕ (garba collector), E ЕА ЖИН 
КАЛ ЕН Н ОҢ R (garbage collection). п, iin Lisp. ML 以 及 Java 之 类 的 高 级 请 
A MERC ES Hr SEMEL COL HAC ER 

ЖСН ЕКО ТА ДЕ А РА А WI NER. RTI 1010 АН A 
ATERA ЖҮНҮН EE РЕН И ЕРИНЕ. mU, TII IT TS a 
ПИЕ. n DL EE S ER [P xp. нш, IE BEER Me FE HE E ERR EA Hs HE ЕК ЖЕ 
EGET KI du fH. ЖЕТЕН КЕНЕНИ ЖИРЕНЕ AERE, ШЖ н 
IF io depo rion. 


10.9.1 malloc 和 free НЫҢ 
C heb ERE LT MOX mallo UETUE ЇЙ Ж} РАС В. 程序 通过 亩 图 malloc 函数 来 从 堆 中 分 配 
E. 


Binclude «stdlib.h» 








void *mallecísize t візе}, 





ан, ФАЗ ИНЕ, Ed E S NULL. 


malla: 函数 返回 一 个 指针 ， ЯН. ҚУА size ҮННЕН НЫ, K HER ШЕН cix 
Hr I WI ОЧ Ж ЕН. ЫП ЖЕН Unix А Б, malo ЈА [B| — + & 3 (ЕШ 
ГУРА, size t EPI MESE A Y unsigned int (C EER), 


mit: 一 个 字 有 多 大 7 
回想 一 下 在 第 3 章 中 我 们 对 TAX КЕКЕНЕ, ше 将 4 $54 BA X, Мк, Ë+ 
Tv. ПЕТА ДАРНА, GRE Tun. idet Eit Em. 


ШШ maloe КЫН (big, Өтеш ЕШ ZEE MU E Ee RT FED FAKE ia K, EAE 
I] NULL. ЖӘЕ ermo. malloc ЖЪН trig pp ERE HE. NOSE E Crane (e ss ép МШЕ FS HE 
Ff ДАН] сайос. calloc 是 一 个 基于 malloc ЖА (wrapper) Ө, ЖЕНЕ ЕТІ 
WE. PERT- FULL ERNA A ар Н eao ЖЖ. 

Мр М С malloc) 可 以 通过 全 用 mmap 和 munmap ЯН, РАНЕ НЕ 
БИЗ, ЖОЕ shrk pi. 
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finclude <unistd.h> 


void *sbrkiint 1пёїг)| 


Ян, EAM bk HH. ЖЕНЕ. 


sbrk i BUR А EEM brk 指针 增加 iner ЖИЕНІН, Ie RUIN. ОЕ] brk МІНІ, 
ШИН, Eia- Ж emo 设置 为 ЕМОМЕМ, ШЕ iner 2 Ж. ЖА sbik 就 返回 мкін EL. 
用 一 个 为 入 的 iner ЖИЕНІ sbrk EAER. ПІН, ІНІНЕН (ык НІНІ) їн йн E Io. [- 
AE abs Ciner "FW. 

程序 是 通过 调用 free REKER C Е REA. 





finclude «stdlib.hs 


| void free(void *ptri; 


мг ЕШ ЯҢ И — F B. malloe БЕЙНЕ py Е, WETE, Ж. free 的 行为 就 是 
ku XM. БИМЕН, ЕМЕНАНЖЕН, free BC ФЕ НЕН Т Ий. ЕЛІН 1041 
作 时 看 到 的 ， 这 会 产生 一 些 字 人 这 了 融 的 运行 时 错误 。 

图 10.36 属 示 了 一 个 malloc 和 free 的 实现 是 如 何 管 理 一 个 忆 程序 的 ІН (EE) "МИНЕ. 
ӨРЕК ЕТ—1 a FEEF. ТОЕТ Зр HTH ENE 
D. Wee. ЖЕШ x d09 16 Tox. Guexp. PAARA. 

. [81036 tax EtWk—^ 4 Ub. malloc ИУ Ж. ДЗ ШЕНИН Л Н — F 4 EIS 

iR, ЖИН —T- fig k TH — HBH. 

• 10.36 (b: 程序 请 求 一 个 5 字 的 霹 。malloe 的 响应 是 ， APARRA EA 6 2 9 

H. ТЕ", maloe ТЕН АЕ T —- 8» Nor. E ü; ГОНЕ ЖК ЕЙ. 
* ШІйЗбіс 程序 请求 一 个 6 字 的 块 ， 而 malloc BA БЕШИ ИЛИ —4- 6 ERR, 
e 10.36 (d): 程序 县 放 在 团 1036 (h) dH PNE 6 EUER. ERE, 在 调用 free jË |p] > 
їп, TTE ро UH ИЕН ТІНЕ, ЕНІНЕН 1 Ий malo ШИ E Shi k > 
ІН, ЖЕЕ р2. 
"1036 (е) 程序 请 求 一 个 2 宰 的 块 。 在 这 种 情况 中 ，maallos НЕН Ed hk u T т) 
M8. HER- tiit ҒЫНЫҢ. 








«АСІЛІСТІ!!!ІІТТІТТІІ 
(alpl = malloc[4*gizeotfiint]] 

B! pe 

КГ ТТТ 


(h)p2 = malloc|5*gizesF(int]] 








ісірі = malloc(2*alzaof (1пї |] 


图 10.3 用 maloc + Н ie 

ЛД T TT. CHE HIE ЕРЕ TÉ. ПЕШӘ k W BIB: М. wik ik Hip). MBI M Е 
Тт МЈ. 
10.92 为 什么 要 使 用 动态 存储 器 分 配 ? 

程序 俺 用 动态 存储 右 分 配 的 最 重要 的 原因 是 它们 既 常 直到 程序 实际 项 和 时 ， 才 知道 基 些 焊 杨 旺 
HW. rm, ELEGERITIRS T C RIF. Ekta t А5СП 码 瑞 数 的 尾 表 ， 每 一 行 一 个 
ERL. M stdin ЗСЕШ, HELL EHE n Е ЕСЕН НІНІ ІН т ЖЕНЕ. 
Min m] A a EH] CEP BR GO] A H CP Re E Xx T BUB 

1 Pinclude "сварр.ћ" 

J Wdefine МАХН 15213 


4 int ағтау|МАЯН|; 


5 
5 int maini) 
[ 
B inb 1, Т) 
4 
10 бап (т #0", &n)i 
11 iE іп > МАХН! 
T. app error(["Input file too Біз"); 
13 fer (1 = D; 1 < nj 1+4] 
lá scanf|*&d*, &arraylil): 
L5 exitiu]: 
16 |] 


ik FERRO D K h k sp ЖЕ ЖАХЛ ДЕНЕ. MAXN 的 值 是 任意 的 ， 和 机 蜂 上 可 用 的 虚 
氢 存 赃 咒 的 实际 热量 设 有 其 系 。 而 且 ， 如 果 这 个 程序 的 使 用 者 想 读 取 一 个 比 MAXN ЖЇНЇ. HE 
-的 办 法 就 是 用 一 个 更 去 的 MAXN 信和 来 重新 编译 这 个 程序 。 堪 对 于 这 个 简单 的 示例 来 说 这 不 成 
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问题 ， 但 是 使 编码 数组 界限 的 出 现 对 于 拥有 百 万 行 代码 和 大 量 使 用 者 的 大 型 软件 产品 而 言 ， 会 变 成 
一 场 维护 的 虱 梦 。 

一 种 更 好 的 方法 是 在 运行 时 ， 在 已 知 了 nm 的 值 之 后 ， 动 态 地 分 配 这 个 数组 。 使 用 这 种 方法 ， 数 
组 大 小 的 最 大 值 就 只 由 可 用 的 庶 氢 存 情 器 数量 来 限制 了 。 


1 #include "csapp.h" 


2 

3 int main (1 

1 { 

5 int *array, 1, п; 

b 

7 scanf ("%3", &п); 

8 array = (int *)Mallociín * sizeofíint)); 
9 for fi = 0; 1 < n: 1++) 

10 scanfí("*d', &аггау[1]); 
11 exit(0); 

lå | 


动态 存储 器 分 配 是 “种 有 用 而 重要 的 编程 技术 。 然 而 ， 为 了 正确 而 高 效 地 使 用 分 配器 ， 程 序 员 
希 要 对 筷 们 是 如 何 工 作 的 有 所 了 解 。 我 们 将 在 1911 节 中 讨论 因为 不 正确 地 使 用 分 配器 所 导致 的 一 
Ein] ІНІНЕН ж. 


10.9.3 ”分 配器 的 要 求 和 目标 
显 式 分 配器 必须 在 -- 些 相当 严格 的 约束 条 件 下 工作 : 
。 处 理 任意 请 求 序列 。 一 个 应 用 可 以 有 任意 序列 的 分 配 请 求 和 释放 请 求 ， 只 要 满足 约 东 条 件 : 
每 个 释放 请 求 必须 对 应 于 -一 个 当前 已 分 负 块 ， 这 个 块 产生 于 以 前 的 分 配 请 求 。 因 此 ， 分 配 
器 不 可 以 假设 分 重 和 释放 请 求 的 顺序 。 例 如 ， 分 配器 不 能 假设 所 有 的 分 配 请 求 都 有 相 匹 配 
的 释放 请 求 ， 或 者 有 相 匹配 的 分 配 和 空闲 请 求 是 嵌 套 的 。 
° 立即 响应 请 求 。 分 村 器 必须 立即 响应 分 配 请 求 。 因 此 ， 不 允许 分 陋 器 为 了 提高 性 能 重新 排 
列 或 者 缓冲 请 求 。 
e ДЕЛЕ, 为 了 使 分 配器 是 口 扩展 的 ， 分 配器 使 用 的 任何 非 标 量 煞 据 结 构 孝 必须 保存 在 排 
H, 
ь 对 齐 块 (对 齐 要 求 )。 分 配器 必须 对 齐 块 ， 使 得 它们 可 以 保存 任何 类 型 的 教 据 对 象 。 在 大 多 
数 系统 中 ， 这 意味 着 分 配器 返回 的 快 是 8 ZW (RE) 边界 对 齐 的 。 
e 不 修 故 已 分 配 的 块 ， 人 外 配器 只 能 操作 驶 者 改变 空闲 所。 特 贿 是， 一 旦 块 被 分 配 了 ， 就 不 多 
许 修改 或 者 移动 它 了 。 因 此 ， 浅 如 讨 缩 已 分 配 块 这 样 的 技术 是 不 允许 使 用 的 。 
在 这 些 限制 条 件 寸 工作， 分 配器 的 编写 者 试图 实现 吞吐 率 最 大 化 和 存储 器 使 用 率 最 人 化 ， 而 这 
黄 个 性 能 日 标 经 常 是 杠 互 冲 突 的 。 
. 目标 1: XXI Su. RE n TAS REGE KI ERES AU: 
Ru К, Ru, Rai 
我 们 希望 -个 分 配器 的 吞吐 率 最 大 化 ， 吞 吐 率 就 是 在 每 个 单位 时 间 里 完成 的 请 求 数 。 例 


832 410% m 
ш, Ш ТАЕ 1 条 中 内 完成 S00 t A fup M 500 ЕШ Ж. NE TEE, 
ЖЕ 1000 X PE. — W 6. ATGA IE ДЕ SAC ЮША Ж EEUU МЕНЕ 
ta REALE. Fimo ЕШ. TE- q RG ВЕРЕ ЕВО d RUE H RH R. SN EP: 
IE JE ff t e CUN SE ELE MI ІНЕН S ЮРДИ HER R. П-ШІ ЕН 
METIR. 
€OHMOSCRXTAHREEHSEA, NIE GER Ж TD ДЕШИ —ЖШ ЕЁ 

Bm. ЖЮ. IRA ERARA S NE EU ERE ЖИ R ЛЕШ Е [шй 

BRERA. РРА Rif dE ELE E AART. ЖАНЕК Н. ЖЕЕ 

K S k yini t Kya hs РЕЛЕ ЖЕ, X ik. 

НЕ ТОСЕ ТРАВ НЕ Е ЕИ А Ар. ҮЕЖЕ а, ТГ ЕЕЕ НЕДЕН 
PAP (peak utilizatioa >. СИЕ FE. Е п tR ЖІНДЕНІІГІЕ 

Кы Rit, В+", Ё; 

和 如果 一 个 虑 用 程序 请 求 一 个 FERR, А, RERUM CL AERE ITI А Cpayload) R р 字 节 ， 
ERR А ЕНЕ In. RATARA (aggregue payload)， 表 示 为 忆 ， 为 当前 已 分 配 的 境 的 有 效 
RR. i 三 表示 堆 的 当前 的 单调 不 降低 的 】 玉 小， 

Ша, ЗАРНА MR Ж, ERY U ШЧ Fei Bl. 
тах H 

Н, 

mk. ACAN НК ЕТЕ ЕТЕНЕ | ЕК НН Ж ШЖК. ЕКЕЖ ПЕ ЖИЙ. Ей 
АКИН “Н ATL PH EZ ШР ШЖ. HE. CUMERUE 3 Cn. ШЕШН 
SAEI TNR. ЖИИ - TE BUT NUK ЕТА НИШ ERI HE ИЕ. 


Ей, ATANA 


我 们 可 以 通过 让 H АЙЕ tA RV, 从 而 使 择 在 我 们 对 U, Py 3, p ido GC RH 
кй. KB ИНЕ АНЕ, 


U, - 


1094 EH 

A CHEM HIER RAE RS E ERE — hik RE (fragmentation) НИН , B dp ЖЕШИН 
Wr HB ЕЕ АЕ SEA ЕИ. КЕЗЕН, ТЖЕ ЕЕН Н. 内 部 碎片 (internal 
fragmentation | AIPA H (external fragmentation ). 

MH E fr OSREIERXEN КЕИ ЕН. ВНЕ РЫН. PES. — 
T-SHVE SEIT] ГЕН е — k'ik AL. а АЧ ЖИГИ А. 
S. ЖЕНГЕН 1036 (b) "PERI. ЫН X o DL SL EFE kit. 

FH REA ikita iman D 089. ААС НЕННЕ m E dao Emm. ME. ems 
54. REEF Са РЕА З FI ТЫ Т ш. Жр 

"HR A K SE ERE Fri ERO EET R, EUH ре аа k 
B| Ll AE RHET ERI IER. Іш, ШЕН 1036 Ce) 中 的 请 求 要 求 5 沾 字 ， 而 不 是 2 个 字 ， Ж 
2, Wr A e AL i ЖЕ ЯН ЫҒЫН CIC HOME КЖ, ШИ ЕҢ ШИК 6 Т-Н. Н 
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ШЕ ЖЕН Tik6Ty Bir t ApH. 

УКЕ HT EC PR АЕР НАТЕ E DRE E, RD COR LU TF EL ЖЕЙ CI A ЖЕНИ; 
X. ШЕ ТРА АКОТ, Hi. RENAR Б, РНН АЛАН 41%. 
ЗЕН? MEN RT MDEU EIC. ange mr Е АЕ АЗЕ ШЕЕ УА 
Tib. ЖАТ ЕТШЕ Н. H-A ШЕН-ТЯЕЕМИЖ Жа тіні. ЖАД 
个 扒 就 会 有 外部 碎片 。 

因为 外 部 雁 片 是 建 以 量化 和 不 可 能 预 届 的 ， 所 以 分 配器 典型 地 采用 启发 起 策略 素 试 图 维持 少量 
MATHE ЖЕ ЕКШЕ Л НА. 


1095 实现 问题 

可 以 想像 出 的 最 简单 的 分 配 回 会 把 起 组 织 成 一 个 太 的 字 节 数组 ， 和 还 有 一 让 指针 Р. ИШИНЕ 
个 数组 的 第 一 个 字 节 。 为 了 分 配 size ҰЯ. malloc $E Pf)" HC ЕШШ. W PORID size， 并 将 
Р КИНЕ ВИН А. free 只 是 简单 地 退回 到 调用 函 晤 ， 而 不 僵 其 他 任何 事情 。 

这 个 障 单 的 分 配器 是 设 计 中 的 一 种 极端 情况 ,因为 峡 个 malloc 和 free Fd Bob dE. S 
吐 诗 会 概 好 ， 嫩 面 ， 因 为 分 配器 从 不 重复 使 月 任何 埃 ， 存 储 器 利用 率 将 概 莽 。 一 个 实际 的 全 配器 要 
在 吞吐 率 千 利用 率 之 间 把 提 好 平衡 ， 就 必须 考虑 肉 下 几 个 问题 ， 

«c vigi. Шс y M? 

 Җ#: RUMAA T ER FIBRE — FE NIST 

e PH: ЕКПЕ -ҺЕРЕБЮӘНЕНЕРТИН2>Е, ПШНДЕ DR HI ШИН 

ж? 

. $H 我们 如 何 处 理 一 个 刚刚 被 释放 的 块 ? 

EINTERI EP IEEE. ЕЛЕНЕ. РАС НЕН іІгітЕ 
КИШ ЕНЕН, Br ELBOR TRE d Mir BO ЗС ч ТЕ d a rp ЖҮННЕН, 


10.56 隐 式 空闲 链 囊 
任何 实际 的 分 配器 都 需要 一 些 数 据 半 煌 ， 沈 许 它 来 区 得 所 边界 ， 并 区 噜 已 分 配 块 和 空 阅 块 。 大 
PN HERMES BU EHUK ep, — d Ry det P 10.37 所 示 。 
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КЕИ", ВЕН Т Kg. TSS. UE ПРИЕ — ИЕАЗ. EH). 9 
BUR ES ГОО АТА h САЕН ГОА Ж), HRD h ЕЛЕ ЙИ Д RR. 如 果 我 们 强 
МЕН У ЭРЕ ЇН. А ЕА R НЕН, Н HEES ЗЕ, Kit. A 
JH WORT САН 29 іе, ИНЕНІ 3 RR C (LRL. 在 这 种 情况 中 ， 我们 用 其 中 的 
最 低位 【已 分 配 位 ) 来 指明 这 个 走 是 已 分 配 的， 还 是 室 亲 的。 禁 恕 ， 假 设 我 们 有 一 个 已 修配 的 热 ， 
Kh 24 (Өкі) "Eb. ВАТА. ШЕН 

üUxDpDQUnO0lS | 2x1 = 0х00000019. 

ЖЫН, Ар 40 (0x28) Т ТІННЕН, 

ОЮ 000000289 | 2xO = 000000028. 

3 LIS ri @ ЛЕ КУ НЙН malloe РЗА КГ. НЕШ E d Her АЕ, Қ 
小 可 以 是 任意 的 。 需 要 填充 有 银 密 原因 。 比 如 ， 卦 充 可 能 是 分 配器 得 酷 的 一 部 分 ， 用 来 对 付 外 部 裕 
Hh. ЖЕНЕ УГЕ R. 

КӨНЕМ А 1037 Ял. Ж {ПОШ НН — Witiy ЕНИ ИНЕ. dn 
ІҢ 1D.38 Fr. 





图 108 ARZTES RAE 
ОУКЕН, PREB GNE. LERES iih CUm pal. 


BU GR PERDE К.т М k. EIS STIEG И З ГЕ K ЕШЮ A HUGE ERE. 2 
Nou EROS ЕНІН, Moses HR Pes HERE EA. ib. RIIS RU ЙЕН 
Менен, ЕТИ Тт, ИЁВЁ—1Ш Тг З Е i d W | terminating 
header). С Ж ПЖНЕ 10.9.12 ӨЗЕНІН, ВИЕБІНЕШШІК T ің.) 

Вас ИНЕК GENE. ЕЖМЕЛ НЕЧА ЕО ЗЕНА, ITIN DUREE, шаны 
ЖЕТЕ НЕЬ о А amisi am tri Ж. 

ІНІН ЖӨ Riku КЕ КЕНЕШИНЕ ТЫ И ЕШ EA b k Tg 
Mr MER. ТЕН Ч РН Баар БЕЛА ТЕ ЛШ. Иш. ШЖ Ей ЭЕ 
ЕЖ, ЖАҢ bm Ke RA OTT REGE. Bib. ВЕ 1032 rH КИНИ 
МАН F. -AFF B—TEHMMAEES. ЕРЕ iW ik W. AU OM 
需要 创建 一 个 两 字 的 块 。 


4 5H 10.6 


确定 下 面 пас ЖЖЖ 4 Hie K dex, Ей. TEM uH. HL N ik 4k 
ЖЫН 10.37 P BM E А, ЕМ k. ЖЕФ л Е НЕН Е АВ. 
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ШЕП 221 
— ашатыны “салы 
[mnes | — | — — — 
[wnenn | — |  — 
эпт | | — 


10.9.7 放置 分 配 的 块 

当 一 个 应 用 请 或 一 个 上 字 节 的 抉 时 ， 分 配 曙 搜索 空 亲 刍 表 ， 查 措 一 个 足 虾 太 、 可 以 放置 所 请 求 
起 的 灾 玫 据 。 分 配器 执行 这 种 搜索 的 方式 是 由 放置 策略 【placement policy). 确定 的 一些 需 见 的 第 
E Eg ER (йы). Т-ЖЙЫ (next fi) ЖЫНЫМ, (best fib. 

K GERM Tu ЧЕ, RERO T nil SHE. T MERERI GERE RU SL, 
АЯШ АД ИЛЕ ӨШИ НЕҢ ИЖ, ТПЕАЕ-Жінны жін. Rate birgt 
THR, ЖЕЕ КААЙН ТЕНЬ. 

ЕКА АС 7 THE dB Bn ЕИ КР ИЧЕ И IE SER ЕШ. Mes CB ЕНІН 
K do tfi b F pom PRI" ET". БЙЯПІМӘХЛХЕНШШЕНМІН. F— GERE iH Donald Knuth 
БАНАН We VB R RISI), NTAXH— THEE. WERL EX TERES ре, 
Fe] Г САС, W Buji F— m Ri] ef ui 8 ih PERCE. Е АНЕ Ii 
{тЫ Н it u. mi. —ЖЕИ ЕШ. F— WR Jr i RUTH НЕ И ОЕ Б 
E. ТЕ ЖЕ НОЕ IL B MGR R F ЕА РОН a C A- Жї. ON ІНЕ 
HES rh, RE Н. AHRR S RE ER EE ERE. ЕШ. 
我 们 将 看 到 更 加 辅 茵 复杂 的 分 离 式 空闲 链表 组 织 ， 它 实现 了 最 忻 适 配 策略 ， 而 不 需要 进行 利 底 的 
Н Ж. 


10.8.8 分割 室 闲 块 

ВАС Н TEENTH CHOSE FEM BOE. ЖЕЛІНЕ TOS HG E 
Jm. РАА ҖЫ, MARATRA Meg. mg qr e ca n citi Е 
ЕН, ЖЕККЕН Е ЕНСЕ. WAR PEEL 80 B ТТЫ ЕЙ, 

Mum. ШЖК ЖК. NAOARBIANRXESHÓETSTHRORUBES.T—€Agd484 
Өн, SEM FATRE- ЕНІН. E 1039 Rog T fion fL B 10:38 h & ERS RR, 
来 满足 一 个 应 用 的 对 境 存 傅 器 3 个 字 的 请 求 ， 
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图 10,3% iiile HAT- m 
ЕРЕН ГЕ ВЕ. "ШЕГИ. Ша S CAR CET Dei. 
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830 I ГИТЕ: 


APAR ЕНТ Se RH ЖЕНИ Аг НЕ СЕЕ ЕЕЕ О, тт, ЕА ЖИЕ 
ЕЕЕ ЕТ Т: 
在 情 器 ， 要 么 是 通过 调用 ттар, ЖЛ КЕЧА sbrk ЖШ. (EE ВАН F. ARE A 
的 【或 增加 的 ) SWEET KIP, ТА ЕЕ А ЧТИ БЕ. M dai c d 
W rik 48083 ih h, 


10.810 Әлен 

"CERE ЕНЕН. ЭГЕН Kise ЕЕ S WW Kim E H SU, ЖЕЕ 
Henie ПЕЕ 8, ШЇ {д} B (Таши fragmentation). i£ rir £T HR S e Bee Ure ЗА 
E EPAR. Dt. BR 10.40 E T REC. 10,39 hai PERI s p. Ga n ua 
АННА. W FILI yT. ШЖ. EFE- ta TE ARE CREAR kW. 
ИЕ ЕТЕ ИИИ ЛЕ. LUATA TAR. 


Кн 







ич | | Ж 
кі: ЕТ 


Ж 10,407 IEEE P 
CAE + ЕП НИЕ ЖАНН ЕМ. ңай CE Ey sme. 


A ТАН RB. ЕМНЖЕБІРЕН ЕЖЕ ЗЕ ЕО РЕЖ. МЕн 
(eoalescing). ЖИЕН Y — TERHERE. ШАЛЫНАТЫН. экаштианатың 
(immediate coalescing): PARERA- rb Wd. ЖӨНІНЕН. ШЖ н 
推迟 党 并 【eferred coalescing) ERRESA TARORA ЗЕ. ӨШ, = п Н 
Aih НИАЕТ ЕИ Ж КЕИ. SET THE, ЕЙІН ІҢ. 

ЖЩ Н ЖЕН Т. MUERA Тра ГУЕ, BES ЕЖЕ ЕШ, Hte 
BEANA. RARAS, КИЧ ЕТИ. Bü. EW 1040 h, БИЮЕН RET 
3 ТЕШЕН ЧЕ К ЖӘЕП Ж. ЕА HEP. RATER DE HEU e E, 
HERET. ВАВА ЖАИ LEE ЕКЕН ЕЗ. 


10.8.01 uh Fels 

irf aS Jim ӘНІ? ІП ЕИПНЕН d e SS Wak. ЖА, ӘН ОИ ШИП 
F — F R B Ra EL. "ПАШ З АН А Е — УВ З 0. ТИРЕ THEE ШЕЕ F — 
Tiii. ШЕН, ЕЛ qr us BUS dps DD oo F. КН HERE ЕЕЕ 
hdd. 

(FE {ПЕШ Pr FERE ET mex a ЖИЕ ЖШШЕ. SH dede 
Ed. IUUENIS. HARIRI. HA НЕ. аң RPUCUNTG free 的 时 
ШЖ SHE А GEREK F. ШИ ЕНЕ ӘНІН ІНЕН, ЖЕНИ ЕЖЕ. 

Knuth HEE 7 ДЕН ОЛА ОВЕ Ж. сін ЖӚНЕ, (boundary (ар), EIER SIEA HET 
HRAS. RARA, mE 10.41 МЛ, ЖЕҢ A api ЫП — P Med Cfooter 边界 标记 )， 
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811041 {ШШ СНА 
EELE L S d E ЕГ ПЕ EE НАЯ, 
|. lE M ERO s P] RE DH A. 
2. ШМЕНЕЕГ КІ, Emi sim. 
4， 全 和 面 的 块 是 空闲 的 ， 而 后 面 的 块 是 已 车 配 的 ， 
4 前面 的 和 后 面 的 块 都 是 空 亲 的 ， 
图 1042 展示 了 我 们 如 何 对 这 四 称 情 况 进行 音 开 。 
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在 情况 ] 中 ， 两 个 邻 接 的 块 痢 是 已 分 配 的 ， 因 此 不 可 能 进行 全 划 。 所 以 当前 冉 的 状 者 但 但 是 此 
已 分 配 谈 成 空 六 。 在 情况 2 中 ， 当 前 块 与 后 面 的 块 台 井 。 用 当前 块 和 局面 块 的 大 小 的 和 来 更 新 当前 
块 的 某 部 和 后 面 埃 的 称 部 。 在 情况 3 中 ， 前 面 的 块 和 当前 块 人 对 并。 用 两 个 块 夫 小 的 和 来 更 新 全 和 面 坏 
指头 部 和 当前 缺 的 脚 部 。 在 情况 4 中， 用 音 并 所 有 的 三 个 块 形成 一 个 单 痢 的 空闲 埃 ， 用 三 个 霹 友 水 
的 和 柬 更 新 前 面 块 的 头 部 和 后 面 块 的 郝 部 ， 在 督 种 情 误 中 ,合并 都 是 在 常 下 时 间 内 完成 的 ， 

边界 标记 的 概念 是 简单 优雅 的 , ЕЛІТЕЛИЕЛЕННЕННІРН ИЕН ӘЛМЕН НІН. ЕТІП. 
Eet- tAE. TER RMR ALEN AA EEEE ТИЕ. 
Arakg ЕРЫ РН. Яш, ПЖ-ТИЕМНІШЕ W WF malloc 和 free, ЖаП БЕІН 
НЕШЕ Н. ЕНЕТИЕНДЕПЕЖЫҒЕМЕТ. HZ 3 RM НЫ D ЭУЕШ 
Ег [ë]. 

£z. ВЕЗЕ О НА НЫ. WAWA C ЛЕНЕ ИЕЫ. [H| 
Ш-К ЧИН ЖР a HORE l WG IE ari iha, AA FERT ñi ih kh SE HT. 
желең, m 3 360 138 B i e D CL) Rn Н iw eE I Her E HER EE GI P HO 
Ph ATEENA. ДИПЛ six d sem mu Het rae T. TIER. 
SR COSE BBA. 

ЕЛІН 10.7 


AETHER ER вы xtd M ib ku. Mi. MEER. roni 
FAE., җн tak kuq 7. 





10.912 R6: 实现 一 个 简单 的 分 配器 

构造 一 个 分 配器 是 一 件 帘 奇 挑战 性 的 尾 范 。 设 计 室 间 钼 去 ， 有 密 科 块 格式 ， 宣 朵 链表 格式 ， 以 
АЕК. Н НИ Ор Е АЕ, Б-ҮРМЕНЛПЕНШЕЕЕЛЕНІНЕРЛЕЕНШЕС 
МИН. ВОТ ЕА Е ЕНЕНЕ И. ЕНЕ FA НЕ ЖЫР. 
BAVTHCBT RERO. ПЕТОК ЕЕН. ВОИ Сна а 2AM 

ЖИ КЕЧЕЕ ИЕ ЫГ Е A А ЖИЫН. GMB TEX Emm. » Т NIA 
— ПЕР = Н &. DH lliu d AX. Aak E HE THE 
Wiña c. 

一 般 分 配器 设计 

我 们 的 分 配器 使 用 如 图 10.43 所 示 的 memlibe ФЕ ЫЕ TERES ERE. МИ {ЕНИН 





1 hik, —## 
1 qne. —## 


虚拟 存储 器 639 


于 允许 我 们 在 不 干涉 已 存在 的 系统 屋 malloe 包 的 情况 卜 ， 适 行 我 们 的 分 配器 。 


code/vmmemltb.c 


1 тіпсізде "сзаро.һп'" 

2 

3 /* private global variables */ 

4 static char *mem start brk; /* ponts to first byte of the heap */ 

5 вайс char "mem Drk; {* points to last byte of the heap */ 

6 static char *mem max addr; /* max virtual address for the heap */ 

7 

8 /* 

9 * тпелі init - initializes the memory system model 

10 */ 

11 void mem initíint size) 

12 Í 

13 mem start БҮК = (char *)Mallocísize); /* models available VM */ 
14 mem brk = mem start brk; /* heap is initially empty */ 
15 mem max addr = mem start, brk + size; /* max VM address for heap */ 
16 ) 

17 

18  j* 

19 . * mem sbrk - simple model of the the sbrk function. Extends the heap 

20 Ж — by incr bytes and returns the start address of the new area. in 

21 * this model, the heap cannot be shrunk. 

27 “/ 

23 void *mem sbrkíint incr) 

2404 

2h char *oàld brk = mem brk: 

26 

A1 if ( (incor < 0) |! ((mem brk + incr} > mem max адаг) } | 
28 errno = ENOMEM; 

29 return (void *)-1; 

30 } 

31 mem brk += incr; 

32 return old brk; 

33 1 


code/vn/memlib.c 
图 10.43 memlib.c: 存储 器 系统 模型 
mem init 酌 数 将 维 可 用 的 吕 拟 存储 器 模型 化 为 一 个 人 前、 双 字 对 齐 的 字 芭 数组 。 丰 


mem, start brk 和 mem brk ІНЕ КЫЛ ЕЛГЕ. mem brk ZB BE Hack o 
和 的 虎 氢 存 情 器 。 分 配 哈 通过 调用 mem sbrk ЕЖЕ ИНЕНІҢ, ХЕ ЖИ sbrk HR 


640 %10% 


ПЕНИЕ. ІП НІ ХЕ, ЕГЕ ЕНЕТІН Ж. 

PAEA КЕНЕП СтаПосс), ПІРДІҢ ІНЕН ТӘН SURE TELS] PERI р. 
A BR Rü d УРА З ЈУ НЕР: 

1 int mm initivoid!; 

2 void *mm mallocísize t sizel; 

3 void mm freeí(void *bp): 

mm init HERR SR. SIR ДАН 0, BURE- mm malloc 和 mm free 也 数 
ЕЛАМАН АН [ВЕЕ DURS XC. AO SS ROUES 10.41 Pros hik K. Bel ki K) 
^ 16 C8. 空间 链 才 组织 成 为 一 个 隐 式 空闲 链表 , 具有 如 图 10.44 ТІНЕ TEX Cinvariant form). 


Tak ШІ Tod > HR n f HU hdr 
A a A LA E  -.T 
КЕ) 


с вана г | hdr v r ex 
D 
起 始 | | | | De 


ЖЕ | 





static char *heap liatp 
10.44 隐 式 空闲 链表 的 恒定 形式 

第 一 个 宁 是 一 个 双 字 朗 界 对 齐 的 不 使 用 的 填充 衬 . 填充 后 面 紧 跟 着 -- 个 特殊 的 序言 块 (prologue 
Моск), wE -个 8 字 节 的 已 分 配 块 ， 只 由 一 个 涉 部 和 -~- 个 脚 部 组 成 。 序 言 块 是 在 初始 化 时 创建 的 ， 
FEKTER. А PLE K PR BJ E 3 ТЕ £ T PH malo ЕЖ free 调用 创建 的 普通 块 。 堆 总 是 以 
一 个 特殊 的 结 是 块 Cepilogue block) KAR, Xe RE Н EE DARE, Н 
Қ. TERAS ERE НЭВТ ЖЕКИ Т. ЗАСН 一 个 单独 的 私有 【静态 ) 全 局 
变量 (heap_listp), "Н ay ER. СЕЛ MEG. RET Ait k-i, АХ 
个 序言 块 。) 

操作 空间 链表 的 基本 常数 和 宕 

图 10.45 展示 了 一 些 我 们 在 分 配器 编码 中 将 监 使 用 的 基本 常数 。 


—r 


code/vm/malloc.c 


/* Basic constants and macros */ 

tdefine WSIZE 4 /* word size (bytes) */ 

define DSIZE 8 /* doubleword size (bytes) */ 

"define CHUNKSIZE (1««12! /* jnitial heap size (bytes) */ 

define OVERHEAD 8 /* overhead of header and footer (bytes) */ 


define MAX(x, y] (4x) > (y)? (x) : (Тұр) 


du och —] Cu ал Фф LS [зэ —: 


Ж Pack a size and allocated bit into а word */ 
1t  £&define PACK(size, alloc} ((size) | (alloc)) 


12 Ё Read and write a word at address p */ 


£552 E 641 


13 ЯдеГіпе GETt(p) (*(size t *J ipi) 

14 tdefine РІТір, vai) (кішіге t *)ip) = (val)) 
it 

16  /f* Read the size and allocated fields from address p */ 

17  $define GET SIZE(p! (СЕТІр) & "OxT?] 

1t  tdefíine GET ALLOCÍDp)! {СЕТ {PY & Uxl) 


26 У Given block ntr bp, compute address of its header and footer */ 


21  $define HDRP (bp) ((сһаг *) (bp) - WSIZE) 
22 define FPRP (DD) ((char *) (6р) + СЕТ SIZE(HDRP(bp]) - DSIZE) 
23 


24 #* Given block ptr bp, compute address of next and previous blocks */ 

25  $define NEXT BLKPIbp] (ісһаг *)(bp) + GET SIZE(((char *) (bp) - WSIZE)) 

26 #define PREV BLKP[bp) (ichar *) (рр) - GET, SIZE(((char *} ibp) - DSIZEI)) 
code/ym/mallac.c 


| 
) 


10.45 ”操作 空闲 链表 的 基本 常数 和 宏 


第 ?一 5 行 定义 了 一 些 基本 的 大 小 常数 ， 字 的 大 小 《WSIZE》 和 双 字 的 大 小 (DSIZE)， 初 妈 宇 
闲 块 的 大 小 和 扩展 堆 时 的 默认 大 小 “CHUNKSIZE )， 以 及 头 部 和 脚 部 古 用 的 开销 字 节 数量 
(OVERHEAD). 

fr Ne P И ЕШШ ЕП п] НЕДЕН ЖДИ. AA UE E K K BOE ТАК 8 YR YI ig 
Ш.Е, ЖИЙ Y ОЕ ВОЗЕ our ЛЛ ES ERRERA ДП (Ж 10-26 7). 
PACK X {第 1017) 将 大 小 和 已 分 配售 钻 合 起 来 ， 并 返回 МЕ, REEL i aE k aB ЕДА 
H, 

GET Ж (第 1350 读 取 和 返回 参数 p 引用 的 字 。 这 里 强制 类 型 转换 是 至 关 重 要 的 。 人 参数 p 典 
型 地 是 一 个 (viod *) 指针 ， 不 可 以 直接 进行 间接 引用 。 类 侯 地 ，PUT Z CR 1417) Жуа 存放 在 
参数 p 指向 的 字 中 。 

GET SIZE 和 GET_ALLOC 4 (第 17~18 行 ) 从 地 址 p ЖЕНУ ЧП, ЖЯ meu K Al 
己 分 配售 。 剩 下 的 宏 是 对 块 指针 《block pointer, Н bp 表示 的 揭 作 ， 块 指针 指向 第 一 个 有 效 载 芥 
字 节 。 给 定 一 个 块 指针 Әр, HDRP 和 ЕТЕР Ж (第 21—22 行 ) 分别 返 冉 指向 这 个 块 的 类 部 和 脚 邵 
的 指针 。NEXT_BLKP 和 PREY_BLKP Ж: (38 25—26 Т) 分 别 返回 指向 后 面 的 抉 和 前 面 的 块 的 块 
指针 。 

可 以 以 多 种 方式 来 编辑 宏 ， 以 操作 空 亲 链表。 比如 ， 给 定 一 个 指 问 当前 抉 的 指针 bp， 我 们 可 以 
ЖЕН Pei ati ЖЛЕ НЕЕ ІНІ d ERE] AU: 


slze E size = GET SIZE(HDRP(NEXT BLKP(bp))); 


创建 初始 空 亲 链 表 
全 调用 mm_malloc 或 者 mm, free 之前， 应 用 必须 通过 调用 mm_init i OK VIAE С ЛДЕ 
10.46). 


code/vm/malloc.c 
l int mm  init(ívoid) 





642 $103 
< i 
3 J create the initial empty heap */ 
4 LE (еар listp = mem кБек(85М517Е)) == МОТ) 
g return -1; 
6 PUT (Һеао listp, 0); /* alignment padding */ 
7 РОТ (heap listpsWSIZE, PACK(OVERHEAD, 1)); Æ prologue header */ 
9 PUT(heap listp4«DSIZE, PACK(OVERHEAD, 1)| /* prologue footer */ 
3 РОТ (пеар listp«WSIZE«DSIZE, РАСК(0, 11); /* epilogue header */ 
10 heap. listp += DSIZE; 
11 
12 /* Extend the empty heap with a free block of CHUNKSIZE bytes */ 
13 itf (extend heapiCHUNKSIZE/WSTaE); == NULL) 
14 return -1; 
15 return 0; 
16 1 


әл------------------:Б-Б-----  гуе/чндпайосес 


图 10.45 mmint: ВЕ — T 783796 А ЖАНЕ 
mm init PCM £e GER ЯНА TE, Op YE TBI IE. MEE MEHTAR СЯ 4 一 
10 行 )。 然 后 它 调 用 extend heap 函数 (图 10.47)， 这 个 阴 数 将 堆 扩 展 CHUNKSIZE + W, JL GUE 
补 始 的 空间 块 ， 此 肇 ， 分 配器 已 初始 化 了 ， 并 县 准备 好 接受 来 自 应 用 的 分 配 和 入 放 请 求 。 


—— — >. 


code/vm/malloc. c 


1 static void *extend_heap(slze_t words) 

2 { 

3 char “Бр; 

4 Біте t 517є; 

5 

Б /* Allocate an even number of words to maintain alignment */ 

7 size = words % 2) ? (words41) * WSIZE : words * WSIZE; 
n if ((int) (bp = пеп sbrkísize)) < 01 

9 return NULL; 

16 

11 {* Initialize free block header/tooter and the epilogue header */ 

12 PUT(HDRPIbp), PACK(size, G); /* free block header */ 
13 PUT(FTRE(bp], PACK(size, 8)); /* tree block footer */ 
14 PUT[(HDRP(NEXT BLÉPibp]), PACK(O, 111; /* new epilogue header */ 
15 

25 /* Coalesce if the previous block was free */ 

1! reLurn Coalesce(bp:: 

18 } 


r 


图 10,47 ехіепс heap: #712999 ЕШ 
extend heap 2% (1: ЛНЫН: (ООҢ a: 04 mm_malloc 不 能 找 


code/vm/malloc.ec 


ДЕ rA 


643 


到 “个 台 适 的 此 配 顽 时 。 为 了 保持 对 齐 ，extend_heap #8 АЛИ E d AA itar bu 27 (8 Т) 
的 借 数 ， 然 后 向 存储 器 系 绕 请 求 额外 的 排 室 间 〈 第 ?了 -9 行 )， 

extend heap 少数 的 剩余 部 分 【第 12—17 17) 在 某 些 方面 昆 很 细微 的 ， 雁 开始 于 一 个 冯 字 对 齐 
КЛ, ARRI extend heap 的 调用 部 返 鼎 一 个 拱 ， 该 区 的 大 小 是 双 字 的 整数 人 者 。 国 此 ， 对 
mem_sbrk 的 每 次 调用 部 返 革 个 双 字 对 齐 的 存 请 器 组 块 (chunk)， 紧 焉 在 结尾 块 的 头 部 后 面 。 这 个 
头 部 变 成 了 新 的 空 首 换 的 头 部 (第 12 行 )， 并 且 这 个 组 块 (chunk) 的 坡 后 一 个 字 变 成 了 新 的 结尾 堪 
的 头 部 (第 14 行 )。 最 后 ,在 很 叮 能 出 现 的 前 一 个 扒 以 一 个 空闲 块 结束 的 情况 中 ， 我 们 调用 coalesce 
消 邹 来 侣 并 两 小 空 辣 块 ， 并 返回 指向 人 台 并 后 的 坎 葛 块 指针 【第 1747). 


HIER 


点 用 通过 调用 mm, free 0 3 (A 10.48), ЗЕРЕ ЕА AR, CP ES ВВЕ ICT GEEK BA 
(bp), MA fe Ri 109.11 节 中 描述 的 边界 标记 合并 技术 将 之 与 邻接 的 空闲 块 合并 起 来 。 








void mm freei(void *bp) 


[ 


j 


size t size = GET SIZEI(HDRP(bp!!; 


PUTiHDRP(bp), PACK(size, 0)); 
PUTIFTRR(bp), РАСКі(віге, 01); 
coalescetbp!: 


static void *coalesce(void *bp) 


{ 


бізге t prev alloc = GET ALLOC(FTREP(PREV БҺЕР (Бә); 
size t next alloc = СЕТ ALLOC(HDRP(NEXT BLKP(Db2)]): 
size t size = GET SIZEIHDRP(Dbp)); 


lf iprev alioc ва next, allac!) | /* Case ] */ 
return bp; 


) 


else if [prev alloc ЕЕ inext alloc) í Pt Case 2 */ 
size += GET SIZE(HDRP(NEXT BLKP(bp))): 
РОТ{НОВР (Бр), PACKisize, 3d); 
РОТ (ЕТЕР(рр), РАСК!вісе,Ор); 
returnibp}; 


else ii {!ргеу_а11ос && next alloc) 1 /* Case 3 */ 
size += GET SIZE(HDRP(PREV. BLEP (bp) )): 
PUTi(FTRP(bp), PACE Size, 2)); 
PUTIHDRPÍPREV BLKP/bp)), PACK[S8ize, 03); 


code/vim/malloc.c 


644 210% 


31 return!/PREV _EBLKP (bp!) ; 

32 } 

33 

34 else ! /* Case 4 */ 
35 size += СЕТ, SIZE(HDRP(PREV BLEPÍDbDp),) + 
36 СЕТ SIZE(FTRP(NEXT BLXPibp?)): 

37 PUTI(HDRP(PREV BLKP(bp)), РАСКіІвіге, 01); 
38 PUT(FTRP(NEXT, ВЬКР(Ьр)), PACKisize, 0)); 
39 reiurn[|PREV BLKP(bp)]); 

40 ] 

4l ] 


code/vm/malloc.c 
B] 10.48 mm free: 释放 一 个 块 ， 并 使 用 边界 标记 合并 将 之 与 
所 有 的 分 接 空 亲 块 在 常 数 时 间 内 合并 起 来 


coalesce rf Ж h tri u k: 1042 "b jue PURI) “种 简单 克 接 的 实现 产 式 ,这 时 也 有 上 毕 骨 
微 的 上 方向， 我 们 选择 的 空闲 链表 格式 一 一 它 的 序 寺 志和 结 虹 块 总 是 标记 为 已 分 本 一 一 允许 我 们 忽 踏 
МЕТЕ НАУА OL Ef. 也 就 是 , 请 求 块 bp 在 堆 的 起 始 处 或 者 是 在 扒 的 结尾 处 . ШЕЙ A ЕН, 
代码 将 混乱 得 多 ， 量 如 容易 出 错 ， 关 且 更 慢 ， 因 为 我 们 将 不 得 不 在 每 次 驾 放 请 求 时 ， 部 去 检 介 这些 
Ж AVIS НА ЯУ, 

ЖАШ 

ЧУН Ж ИЛИН mm_malloc ЕЖ (ËB 10.49) 来 向 存储 如 请求 大 小 为 size ТІН. ir 
ЛЕЖАЈА А CH 80-9 110, SAG ЖЖЖИНИ ЖИНА. Jof AGED НІ == B), Л 
满目 双 字 对 肖 要 求 。 第 12~13 行 强制 了 最 小 块 太 小 是 16 X: 83 W (DSIZE) ЖА 
Ж, ШУК 8 (OVERHEAD) HK ТЕ. АТАНЫ S Y PAY CA 1547), ЖЫ 
则 是 如 了 上 开销 字 W, WK ЕА mu sns (DIZE). 


—  -— T — 





Codz/vmimalloc.e 


1 võid “пі mallocísize t size) 

2 | 

3 Size 5 asize; i* adjusted Diock size */ 

4 size_L extendsize;  /* amount to extend heap if no fit */ 
5 char *bp; 

b 

7 f* [gnore spurious requests */ 

s it [size <= Ü) 

g return NULL; 

19 

11 /* Adjust block size to include overhead and alignment reqs. */ 

12 if [size <= DSIZE] 

13 авіуе = DSIZE + OVERHEAD; 

14 else 

15 asize = DSIZE * (i(size + (OVERHEAD) + (DSIZE-1)) / DSIZE); 
16 


17 /* Search the free list for a fit */ 


虚拟 存 情 器 645 


18 if {{рр = find fit{asize)} != NULL) £ 
19 placeibp, asizeëe); 

20 return bp; 

21 } 

22 

23 /* No fit found. Get more memory and place the block */ 
24 extendsize = MAX[asize,CHUNKSIZE); 

25 if ((bp - extend heapíextendsize/WSIZE)) -- NULL) 
25 return NULL; 

27 різсеі4рр, авіт?е); 

28 return bp; 

23 } 


coqe/ymómalloc.c 


图 10.49 mm malloc: ДЕН Ж Ad 


日 分 配器 调整 了 请 求 的 大 小 ， 它 就 会 搜索 空闲 链表 ， 和 寻找 一 个 合适 的 空闲 块 第 18 行 )。 如 
果 有 合适 汐 ， 那 么 分 配器 就 放置 这 个 请 求 块 ， 并 有 选择 地 分 制 出 多 余部 分 【第 19 行 )， 然 后 返 划 新 
分 配 块 的 地 址 CE 2017). 
如 有 未 分 配器 不 能 够 此 现 一 个 下 配 的 式 ， 那 么 就 用 一 个 新 的 空闲 块 来 扩展 夫 (第 24~26 行 )， 把 
请 求 块 放置 在 这 个 新 的 空 闪 块 蛙 ， 有 选 拌 地 分 割 这 个 块 《第 27 行 )， 然 后 返回 一 个 指针 ， 指 问 这 个 
新 分 配 的 块 【《 第 28147). 


练习 题 10.8 
为 10.9.12 节 中 描述 的 简单 分 配器 实现 一 个 find. fit iit, 


static void *find fitisize t asize) 


你 的 解答 应 该 对 隐 式 空闲 链表 执行 首次 适 配 搜 索 ， 


练习 题 10.9 
为 示例 的 分 配器 编写 一 个 Place БЖ. 
static void placelvoid *bp, size t asize) 


ТВ ЕИ DOCE E RR dede Y. АЖ GG eR EE k 3 TX 43 EBE) 
HX. qu. 


10.9.13 FAHR 

隐 式 空闲 链表 为 我 们 提供 了 -HARUMA t ААВ ТЕ, АШ. КАЛША!» 
堆 块 的 总 数 号 线 性 关系 ， 所 以 对 于 通用 的 分 配器 ， 隐 式 宝 闲 链表 是 不 送 合 的 (尽管 对 十 堆 块 数量 巴 
先 就 知道 是 很 小 的 特殊 的 分 配器 来 说 ， 它 是 比较 好 的 )。 

一 种 更 好 的 方法 是 将 空闲 块 组 织 为 某 种 形式 的 显 式 数据 结构 。 因 为 根据 定义 ， 程 序 是 不 需 村 一 
个 空闲 块 芍 主体 ， 所 以 实现 这 个 数据 结构 的 指针 可 以 存放 在 这 些 空闲 拨 的 主体 蛙 面 。 例 如 ， 堆 可 以 
组 织 成 一 个 双向 空闲 链表 ， 在 每 个 空闲 块 中 ， 部 包含 一 个 pred ОН) 和 suce Or 指针 ， 如 图 
10.50 ж. 
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使 用 双 同 链表 ， 而 不 是 隐 式 空闲 链表 ， 使 首次 适 本 的 分 本 时 间 从 块 总 数 的 线性 时 间 减 少 到 了 了 空 
用 卖 数 旦 的 线 必 时间。 不过， 节 放 个 块 的 时 间 可 以 是 线性 的 ， 也 可 能 是个 常数 ， 这 取决 于 我 们 在 
至 用 链表 中 对 块 排 序 所 选择 的 策略 。 

ЛАЖНА (РО) 的 顺序 维护 链 丰 ， 将 新 释放 的 块 放 堵 在 链表 的 开始 处 。 使 用 
LIFO 的 般 压 和 首次 近 配 的 放 官 策略 ,分 配 右 会 最 先 检 但 最 近 使 用 过 的 块 。 在 这 种 情况 下 ， 释 放 -个 
岂可 以 在 常数 时 间 内 守成。 如果 使 用 了 这 内 标 记 ， 那 么 合并 也 可 以 在 常数 时 间 内 穹 成 。 

д “种 方法 是 授 照 地 址 顺序 来 维护 链表 ， 其 中 链表 中 每 个 块 的 地 址 都 小 于 它 祖先 的 地 址 。 在 这 
种 情况 下 ， 脱 放 一 个 块 需 要 线性 时 间 的 搜索 ， 来 定位 合适 的 祖先 。 平 衡 点 在 于 ， 按 丫 地 址 排序 的 首 
KERGE LIFO 和 持 序 的 首次 适 配 有 更 高 的 存储 器 利用 率 ， 接 近 最 件 适 配 舶 利用 率 ， 

-最 而 二 ， 显 式 链 表 的 缺 扣 是 空前 块 必须 足够 大 ， 以 包含 所 有 需要 的 指针 ， 以 及 头 部 和 可 能 的 
脚 部 。 这 惑 导 第 了 更 大 的 最 小 块 大小 ， 也 潜在 地 提高 了 内 部 碎片 的 程度 ， 
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用 链表 ， 共 中 每 个 链表 中 的 块 有 大 敏 相等 的 人 小 。 

一 般 的 思路 是 将 所 有 品 能 的 块 大 小 分 成 一 些 等 价 类 ， 也 叫做 大 小 类 (size classj。 有 很 多 种 方式 
Жа ХК. ш, ЗОНЕ 2 Ж ЖЫШ КА. 
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TX SEAT УСАА ТН Ж ЛАНА ERKKA РЕГАР зе УА, 
何 时 进行 合并 ， 何 时 间 操 作 系 统 请 求 额 外 的 堆 存储 器 ， 基 否 多 许 分 割 ， 等 等 。 为 了 使 你 大 致 了 解 有 
哪些 可 能 性 ， 我 们 会 描述 两 种 基本 的 方法 ， 简 单 分 离 存 储 (simple segregated storage) МІЯ 0 18 ве 
(segregated fit). 


简章 分 离 存 赃 

使 用 简单 分 离 存 和 储 ， 每 个 大 小 类 的 宅 亲 链表 包含 大 小 相等 的 块 ， 每 个 决 的 大 小 就 是 这 个 入 小 类 
中 报 大 元 素 的 类 小 ， 例 如， 姑 果 某 个 大 小 类 定义 为 117-32}， 那 么 这 个 类 的 空闲 链表 全 出 大 小 为 32 
的 块 组 成 。 

为 了 分 配 - ' 人 给 定 大 小 的 块 ， 我 们 检查 相应 的 字 闲 链表 。 如 果 链 表 非 空 ， 我 们 简单 地 分 配 其 中 
第 一 块 的 全 部 。 容 闲 块 是 不 会 分 出 以 袜 足 分配 请 求 的 。 可 果 链 表 为 宇 ， 分 配器 就 向 操作 系统 请 求 一 
个 固定 大 小 的 额外 存 情 器 组 号 《典型 地 是 页 面 大 小 的 整数 局)， 将 这 个 组 志 (chunk) 分 成 大 小 相等 
的 员 ， 并 将 这 些 块 链 接 起 来 形成 新 的 宅 闲 链表 。 要 释放 - -个 块 ， 分 配器 只 要 简单 地 将 这 个 抉择 入 到 
相应 的 空闲 链表 前 前 部 。 

这 种 简单 方法 有 许多 优点 。 分 配 和 释放 块 都 是 很 快 的 常数 时 间 操 作 。 而 且 ， 每 个 组 块 (chunk) 
中 都 是 大 小 相等 的 块 ， 不 分 割 ， 不 台 并 ， 这 意味 着 每 个 扎 只 有 很 少 的 存储 器 开销 。 既 然 每 个 组 块 只 
有 太 小 相同 时 卖 ， 那 么 一 个 已 分 配合 的 大 小 就 可 忆 从 它 的 地 址 中 推断 出 来 。 因 为 没有 合并 ， 所 以 已 
分 徊 民 乓 头 部 就 不 震 更 一 个 已 分 配 空 限 标 记 。 因 此 已 分 配 氛 不 需要 头 部 ， 同 时 因为 没有 人 合并， 它们 
也 人 需要 脚 部 。 因 为 分 配 和 攻 放 操作 都 是 在 空闲 链表 的 起 始 处 操作 ， 所 以 链表 其 需 昌 是 单 回 的 ， 而 
不 用 是 邓 加 的 了 .关键 点 在 于 , 惟一 在 任何 此 中 都 需要 的 字段 是 每 个 空 刚 顽 中 的 一 个 字 的 succ 指针 ， 
因此 最 小 块 大 小 就 是 一 个 字 。 

一 小 显著 的 缺点 是 ， 简 单 分 离 存 储 很 容易 造成 内 部 和 外 部 碎片 。 因 为 空闲 块 是 不 会 被 分 割 的 ， 
所 以 可 能 会 造成 内 部 碎片 。 更 糟 的 是 ， 某 些 引用 模式 会 引起 极 多 的 外 部 碎片 ， 因 为 是 不 会 合并 空闲 
块 的 《练习 题 10.10)。 

研究 者 提出 了 一 种 粗粮 的 合并 形式 来 对 付 外 部 碎片 问题 。 分 配器 记录 操作 系统 返回 的 每 个 存储 
ER 《chunk》 中 的 空闲 如 的 数量 。 无 论 何 时 ， 如 果 有 一 :个 组 块 完全 出 空 用 块 组 成 ， 那 么 分 配器 就 
从 它 的 当前 天 小 类 中 删除 这 个 组 块 ， 使 得 它 对 其 他 大 小 类 可 用 。 


练习 题 10.10 

描述 一 个 在 基于 简单 分 离 存储 的 分 配器 中 会 导致 严重 外 部 碎片 的 引用 模式 ， 

分 离 适 配 

使 用 这 种 方法 ， 分 配 夏 维护 着 一 -个 空闲 链表 的 数组 。 每 个 空闲 链表 是 和 一 个 大 小 类 相关 联 的 ， 
并 日 被 组 织 成 蘑 种 类 型 的 显 式 或 隐 式 链 表 。 每 个 链表 包含 潜在 的 大 小 不 同 交 块 ， 这 些 块 的 入 小 是 大 
小 英 鸭 肛 员 。 有 许多 种 不 同 的 分 离 适 配 分 配器 。 这 里 ， 我 们 描述 了 一 种 简单 的 版 本 。 

为 了 分 配 一 个 块 ， 我 们 必须 确定 请 求 的 大 小 类 ， 并 及 对 适当 的 空闲 链表 做 首次 适 孔 ， 查 找 -个 
а. ШАВ Г, ЖАВИ САЛ) 分 割 它 ， 并 将 剩余 的 部 分 插入 到 适当 的 空 用 
链表 中 。 妈 末 我 们 找 不 到 合适 的 僻 ， 堵 么 我 们 就 搜索 下 一 个 更 大 的 大 小 类 的 宝 闲 链 表 。 如 此 重复 ， 
直到 找到 一 个 合适 的 块 。 如 果 设 有 空闲 链表 中 有 合适 的 块 ， 那 么 我 们 就 向 操作 系统 请 求 额外 的 堆 存 
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Бане, МОНИ GERE SEP Bo Н УА, AROR YK R TERR AUD Kop Sn, HEW -个 块 ， 
我 们 执行 合计 ， 并 将 编 果 放 置 到 相应 的 空 用 链表 中 。 

4r RUBRO GE КЕ ИНД. С 标准 库 中 提供 的 GNU maloe 包 就 是 水 用 的 这 种 方法 ， 因 
为 这 种 方法 牙 快 速 ， 姑 人 存 刷 路 的 使 用 出 很 有 效率 。 搜 索 时 间 减 少 了 ， 国 为 搜索 被 限制 在 堆 的 某 个 部 
Ж» WAERT 存储 器 利用 率 得 到 了 改善 ， 内 为 有 一 个 有 趣 的 事实 : 对 分 离 空 亲 链 表 的 简单 的 
А Н УНЕТА (ЕАК. 

伙伴 系统 

КЕРА SE (buddy system) 是 公 离 匹配 的 一 种 特 鲍 ， 其 中 每 个 大 小 类 者 是 2 By. ЖЖК 
是 假设 一 个 鹰 的 大 小 为 2 个 字 ， 我 们 为 每 个 雪人 小 和 维护 一 个 分 离 空 阴 链 表 ， 其 中 心 & < m. 请 
求 顽 大 小 加 上 上 舍 入 到 最 接近 的 2 的 景 。 坊 开始 时 ， 只 有 一 个 大 小 为 2 个 字 的 空 亲 块 。 

为 了 分 配 -个 大 小 为 人 的 块 ， 我 们 找到 第 一 个 可 用 的 、 大 小 为 宪 的 块 ， 其 中 庆 <j< im。 如 盯 j= 
k， 擅 么 我 们 就 完成 了 。 否 则 ， 我 们 递归 地 二 分 这 个 块 ， 直 到 了 = 六 。 当 我 们 进行 这 样 的 分 割 时 ， 每 个 
RFT Genio, elt tie eap pem puse. EET ADOS 2 的 块 ， 我 们 继续 合 
并 空 用 的 伙伴 。 当 我 们 过 到 一 个 已 分 配 的 伙伴 时 ， 我 们 就 停止 合并 。 

关于 伙 件 系统 的 一个 关键 事实 扎 ， 络 定 地 址 和 抉 的 大 小 ,很 容易 计算 出 它 的 伙伴 的 地 址 。 例如 ， 
-个 大， 大 小 为 好 字 节 ， 地 址 为 ， 

XxX..Xxü000u 

e BH TT a nF Ay 

xxx..x1/]000ü 
АНДАЙ, ARERI E RERA 一 位 不 相同 ， 

伙 什 系统 分 配器 前 主要 优点 是 它 的 快速 牟 索 和 快速 合并 。 主 要 缺点 是 要 求 块 大 小 为 2 ms ГЕ 
姓 纺 显 兰 的 内 部 在 族 。 因 此 ， 人 炙 任 系统 分 配器 不 适合 通用 目的 的 工作 负载 ， 然 而 ， 对 于 基 些 与 应 用 
相关 的 工作 负载 ， 其 中 块 大 小 预先 知道 是 2 的 属 ， 伙 伴 系 统 分 配器 就 很 有 吸引 上 山 了 。 


1010 垃圾 收集 


АЛАШ С malloc 包 这 样 的 显 式 分 配器 中 ， 应 用 通过 调用 maloe 和 free 来 分 配 和 释放 堆 块 。 应 
用 坚 什 页 释 丰 所 有 不 骨 需 要 的 已 分 配 块 ， 

木 能 释放 忆 分 配 的 块 是 一 种 常见 的 网 程 错 误 。 全 如， 考虑 直面 的 和 的 数 ， 作 为 处 理 的 一 部 分 ， 
ЕРА АВ: 


1 vold darbage(t) 
^ ! 

4 int *» = iint *;jMallocí15213); 

1 

5 return; /* array pis garbage at this point */ 
b ] 


ROS FEFEASBE SS E p， 所 以 在 garbage 返回 前 应 该 释放 p。 不 幸 和 的 是 ， 程 序 员 忘 了 释放 这 个 块 。 


ЕФ 8 649 


ҮЛЕН ЕЕ АИЫ ИККЕ Ch ЖАҚЫ. ЕРЕН АЖ ЖЖ ЛИН ER ІН 7 TRES BJ 
HE [8]. 

垃圾 收集 器 (garbage collector) Е-Е ЕН, ВУНЕ К ЕМЕ CHR. 
АЗЫ PA АУ А garbage), АЛИЯ ДАЖЕ. H muU r f RO E Re Bu АА 
€ (garbage collection), ñ: — SCEERORU SERI SR ZEB. PHI АЛЕН, (H MO W Hh SET 
Ei. VE C ET RIEF xr. MARA malloc， 但 是 从 不 调用 бее. KREE. Н RARE 
КІНА, АНУ free, ЖЕЕ Н Sum DRE RH. 

u 1 S п] Dis 21| John McCarthy 在 20 世纪 60 年 代 早 期 在 MIT ЖЕН Lisp 系统 , 它 是 庄 如 
Java. ML. Perl 和 Mathematica #9 {МЕ 8 ЖЖ F B ES. mH 47028 TESCO! 
域 。 ARLAS ХЕ E TE HORE S Aged. ВИТЕБ Р McCarthy 独创 的 
Mark&Sweep 【标记 点 清除 )】 算法 ， 这 个 算法 很 有 趣 ， 因 为 名 可 以 建立 在 已 存在 的 malloc E fH it 
之 上 ， 为 忆 和 C++ 程序 提供 垃圾 路 集 。 


10101 垃圾 收集 器 的 基本 要 素 

垃 胡 收集 器 将 存储 器 况 为 - 张 有 向 可 达 图 (reachability graph), ЕДШ! 10.3 Sp. wi 
的 节点 被 分 成 一 组 根 节 点 (root node) 1—28 3 5. (heap node)。 每 个 堆 邓 点 对 应 于 扒 中 的 -个 已 
A EUR. 有 同 边 p 一 а КЖ ИЙ p h ЖТ ЈА q 中 的 某 个 位 置 , 根 节点 对 应 于 这 样 种 不 
在 堆 中 的 位 置 ， 它 们 中 包含 指向 堆 中 的 指针 。 这 些 位 置 可 以 是 寄存 器 ， 栈 里 的 变量 ， 或 者 是 虚拟 存 
悄 器 中 读 写 数据 区 域内 的 全 局 变量 ， 
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图 10.51 IRI ERES 68 RET ANA 


当 存 在 一 条 从 任意 根 节点 出 发 并 到 达 p 的 有 向 路 径 时 ， 我 们 说 -个 节点 p 是 可 达 Ceachable). 
在 任何 时 刻 ， 和 垃圾 相对 应 的 不 可 达 节 点 是 不 能 被 应 用 再 次 使 用 的 。 垃 圾 收集 器 的 角色 是 维护 可 和 达 
图 的 某 种 表示 ， 并 通过 释放 不 可 达 节 点 并 将 它们 返回 给 空闲 链表 ， 来 定期 地 四 收 它们 。 

像 ML 和 Java 这 样 的 语言 的 垃圾 收集 器 ， 对 应 用 如 何 创建 和 第 用 指针 有 很 闫 格 的 控制 ， ВЕЕ 
护 可 达 图 网 -种 鱼网 的 表示 ， 因 此 也 就 能 够 回收 所 有 垃圾 。 然 而 ,诸如 全 各 避 4+ 这 样 的 语言 的 收 佘 
铝 通 币 不 能 维持 可 达 图 的 精确 表示 。 这 样 的 收集 器 也 叫做 保守 的 垃圾 收集 回 【conservative garbage 
coiiector)》。 从 某 种 意义 上 来 次 它们 是 保守 的 ， 也 就 是 ， 每 个 吕 达 块 都 被 正确 地 标记 为 可 达 了 ， 而 - - 
些 不 可 达 节 点 却 可 能 被 错误 地 标记 为 可 达 。 

收集 器 可 以 按 需 提供 它们 的 服务 ， 或 者 它们 可 以 作为 一 个 和 应 用 并 行 的 独立 线 笠 ， 不 断 地 更 新 
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8T XA Bg ET o A АП, ЕТІН УСЕН — P SE BU ЗЫП А. CA ERE] malloc 包 中 ， 
如 图 10.52 Bra. 
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10,52 Ж-ТЯСИМВЕЖИЛАЕІ-СЗС malloc 包 中 


A Ven ММ ЗЫ тн. EA RDÉCS S IRR malloc. ШЕ malloc 找 不 到 一 个 合适 的 
нх AE MATARAE ЖЇН НЕЧЕ 10 EKRE TAHER. MRA RaR, Л: 
RRN free MOTENE EIS . 关键 的 根 法 是 收集 器 代替 应 用 去 调用 free, SIK E 25 ИН 

MN, mur SUL UN Cisma. БЫ) AA КӨ Kitap 
ЖУКЕ. Beli, malloc 返回 一 个 指向 请 求 记 的 指针 (如果 成 功 》 或 者 返回 一 个 空 指导 (如 果 
АДЫ), 


10.10.22 Mark&Sweep 垃圾 收集 器 
Mark&Sweep 垃圾 收集 器 中 标记 (mark ) 阶段 和 清除 (sweep) 阶段 组 成 。 标 记 阶 段 标 记 出 根 节 
点 的 外 有 可 过 的 和 已 分 配 的 后 继 ， 而 所 而 的 请 除 阶段 释放 每 个 未 被 标记 的 已 分 配 块 。 典 型 地 ， 块 闲 
部 中 空闲 鸭 低 位 中 的 一 位 昨 来 表示 这 个 块 是 否 被 标记 了 。 
ЖАПТЫ Mark&Sweep 的 描述 将 假设 使 用 下 列 函 数 ， 其 中 ptr 定义 为 typedef char *ptr: 
е htr isPtr (ptr p: 旭 果 pp 指向 一 个 已 分 配 块 中 的 某 个 平 ， 那 么 就 返回 “全 指 癌 这 个 块 的 起 始 
{ЖЇН b. ЖШ Н] NULL. 
• iüntblockMarked(ptr by: BUR Cz bk Jih, EZ XR In true. 
• int blockAllocated(ptr b): ЖЖ Ea b 是 已 分 配 的 ， 那 么 就 返回 true, 
а үсій markBlock(ptrb); 标记 块 b。 
e intlength(b): EPH b 的 字 上 长 CBE, 
* void unmarkBlock(ptr b): £2 b 的 状态 由 已 标记 的 改 为 未 标记 的 。 
» ptr nextBlock(ptr b): [8 Ь 的 后 继 。 
村 也 阶段 为 每 个 根 季 点 调用 一 次 图 10.53 Ca) 所 水 的 mark ЖЖ. Шр ЖН :个 局 分 本 并 
Н ЖКА А. mak 函数 就 并 戎 返回 ,省 则 ， 它 就 标记 这 个 块 ， 并 对 块 中 的 每 个 空 递归 地 调用 它 
Hil. 每 次 对 mark 函数 的 调用 都 标记 某 个 根 节 点 的 所 有 未 标记 并 且 可 达 的 后 继 节 点 。 在 标记 阶段 
的 森 尾 ， 任 何 坟 标记 的 已 分 负 所 都 被 认定 为 是 不 可 达 的 ， 是 垃圾 ， 可 以 在 清除 阶段 回收 ， 
清除 阶段 是 对 图 10.53 (b) 所 未 的 sweep 函数 的 ХИ. sweep ЖЖ ТЕЕ ТА Ex (fé 
环 ， 群 放 它 所 过 到 的 所 有 未 标记 的 已 分 配 块 (也 就 是 垃圾 )。 
void markiptr р) Í 
12 (16 = isPtrlp)) == NULL) vo-d ямеесіріс b, ріг end) { 
return; while (b < end) 1 
itf (blockMarked(b)) 1f (blockMarkedir)) 
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return; unmarkBlockib); 
WmarkBlockíb!;: else itf (blockAllocated!b)] 
len = lengtaiíb); Ггрееірі; 
for 11-0; i < len; із) р = пехеБіссЕеір); 

магк (6111): | 
return; return; 


} ] 
Ж 10.53 mark 和 sweep AAPEEE 
图 10.54 展 加 了 一 个 小 堆 的 Mark&Sweep 的 图 形 化 解释 。 块 边界 用 粗 线条 表示 。 每 个 方块 对 应 
于 存储 器 中 的 -修平 。 每 个 块 有 一 个 字 前 头 部 ， 要 各 是 标记 了 的 ， 要 人 么 是 未 标记 的 ， 
Rool 


тн e e 
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ERTE ÀI: 
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В: 


ЕКИП 





10.54 ”标记 和 清除 示例 
注意 这 个 示例 中 节 箭 涉 表示 存 情 器 引用 ， 向 木 是 空间 链表 指针 ， 


жене, k. BL 10.54 中 的 堆 由 六 个 已 分 配 卖 组 成 ， 其 中 每 个 块 都 是 未 分 铠 的 。 第 3 块 包 仿 -- 
个 指 四 第 1 块 的 指 计 。 第 4 块 包含 指 问 第 3 块 和 第 6 鼎 的 指针 。 根 指 同 第 4 块 。 在 标记 阶段 之 后 ， 
第 1 梁 、 第 3 决 、 第 4 块 和 第 6 块 被 做 了 标记 ， 因 为 它们 是 从 根 节 点 可 达 的 。 第 2 抉 和 第 5 块 是 末 
怀 刀 的 ， 因 为 它们 是 不 可 达 的 。 在 清除 阶段 之 后 ， 这 两 个 不 可 达 块 被 全 收 到 空闲 链表 。 


10.10.3 СЕРАН ЖТ Mark&Sweep 

Mark&Sweep H СЛН Bš IK SEE — АЕ Е. AAE LALE, ТАИ: 
МЕ. Ж, CEFA isPtr НЕШЕ Y 一 些 有 趣 的 挑战 。 

第 一 ,和 不 会 用 任何 闫 型 信息 来 标记 存储 器 位 置 。 因 此 ， 对 isPtr 没有 一 种 明显 的 方式 来 判断 它 
的 输入 参数 p 是 不 是 一 个 指针 。 第 二 ， 即 使 我 们 知道 p 是 一 个 指针 ， 对 isPtr 也 没有 明显 的 方式 来 判 
Br p 是 否 指 向 一 个 已 分 配 块 的 有 效 载荷 中 的 某 个 位 置 。 

对 后 - -问题 的 解决 方法 是 将 已 分 电 块 集合 维护 成 一 样 乎 衡 二 名 树 , 这 棵 树 保持 着 这 样 : .个 属性 ; 
苞 子 树 中 的 所 有 块 都 放 在 较 小 的 地 址 对 ， 而 布 子 树 中 的 所 有 块 都 放 在 较 大 的 地 址 处 。 如 图 10.55 所 
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Яя» 过 三 要 求 每 个 已 分 配 块 的 类 部 里 有 购 个 附加 学 段 (eft 1 righ. ТТЕСПЕНКАЖ МЕНІН 
头 部 。 


15} Ай 


Remainder of block 





ІҢ 10.55 ”一 棵 已 分 配 块 的 平衡 树 中 的 左右 指针 

isPtr(ptr 中 却 数 用 树 来 执行 对 已 分 配 块 的 一 分 但 找 。 在 每 一 步 中 , УЗВ AERE 
ЖТ р 基 宪 落 在 这 个 块 的 范围 之 内 。 

从 某 种 启 义 上 来 说 ,平衡 三 方法 是 正确 的 ， 例 如 它 保证 会 标记 所 有 从 根 季 点 可 达 的 车 点。 这 是 
一 个 必要 的 保证 ， 因 为 应 用 程序 的 用 广 当 然 不 会 言 欢 把 它们 的 已 分 配 块 过 旱地 返回 给 定 闲 链 志 。 然 
而 ， 这 科 上 方法 从 杀 种 意 必 二 而 主攻 中 各 守 有 的 ， 因 为 它 可 能 不 正确 地 标记 实际 下 不 可 友 的 块 ， 开 因此 
不 能 释放 菜 些 垃圾 。 昌 然 这 上 开 个 影响 应 用 程序 的 正确 性 ， 但 是 这 而 能 导致 不 必要 的 外 部 伴 片 。 

C 程序 的 Mark&Sweep 收集 器 必须 是 保守 有 的， 其 根本 原因 是 CC 语言 不 会 几 类 型 信息 来 标记 看 全 
器 位 育 。 因 此 ， 像 int 或 者 float xx E ER АЛЕН. ЯШ, Бил ТОПАН B r RUR GU 
的 有 效 载 荷 中 包含 一 个 int, HERDET EECa ME b BS REPRE IS beso Se 
促 而 吉 ， 是 没有 少 法 推断 出 这 个 数据 实际 上 是 imme. Bg. УТЕЕВА bif 
алуа, hogSSe КЕЗЕ Ел ER. 


10.11 C 程序 中 常见 的 与 存储 器 有 关 的 错误 


A C 程序 员 闪 说 ， 管 理 和 征用 虽 拟 存储 器 可 能 是 今 困难 的 、 容 易 出 错 的 任务 。 与 仓储 器 大 的 
RRT ER TAREN R AACA ТЕ [рна 8] Е, НЕНИ RA A 
KINK. HARRERA S AEREE, ЖЕНГЕ AIC aie] T ULT MN. H 
(РЕТІМЕН ERRAR CERET. RAER И ИРЕ X RU MEE. ЖЕ 
KUU SET а таса 


10.11.1 ІНІНЕН 

ПИЕ 10.7.2 TRASA, ПЖ FER d UOCE РЕН КЕЛИ, KARIHAARAN 
Жн. us de n НІН Bes RH -ЧЕНДЕНЕРНЕН. HABER SUB RE SIEUT. 
ПІН, EITT ЗЕН ЖЕК ЕЛЕН. УХЕ x BE DLP RE ix Ey, 

їп) НИ УА Е АН] scanf fix. БЕН EHEH асам 从 stdin 该 一 个 
整数 到 一 个 变量 。 ОХ ЕНЕ АЛГЕ ОВ 85 «ап - -个 格式 串 和 变量 的 地 址 :; 

scanfí'&d", kval) 

ЖІП, «FT C 程序 员 官 学 者 而 言 GAARA ҚАНЫН», PARIER val ШИЙ. WEET 
的 地 址 ， 


scanfi'€d", val) 
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ACRI F, scanf 将 把 val 的 内 容 解释 为 一 个 地 址 ， 并 试图 将 一 个 字 写 到 这 个 位 置 。 在 最 好 
的 情况 下 ,程序 立即 以 异常 终止 。 ARRENE O va 的 内 容 对 应 于 虚拟 存储 器 的 某 个 合法 的 读 
/号 区 域 ， 于 是 我 们 就 覆 葡 了 存储 器 ， 这 通常 会 在 相当 以 后 造成 灾难 性 的 、 令 人 困 感 的 后 果 。 


10112 ” 读 未 初始 化 的 存储 器 
BA bs 存储 器 位 置 ( 诸 如 未 初始 化 的 全 局 СШ) 总 是 被 加 载 器 初始 化 为 零 ， 但 是 对 于 奴 存 
情 器 却 并 不 是 这 样 的 ， 一 个 常见 的 错误 就 是 假设 堆 存 情 器 被 初始 化 为 警 : 
/* return y = Ax */ 
int *matvecíint **A, int *x, int п) 


| 


int 1, `; 
int *y = (int *jMallocín * ві?еоҒізтеуу; 
tor (1 = 0; i < n; i++} 

For (j = 0: j < n; j++) 


yli] += А[1][1] * x[3]; 
return v; 


在 这 个 示例 中 ， 程 序 员 不 正确 地 假设 向 量 被 初始 化 为 零 。 正 确 的 实现 方式 是 在 第 8 行 和 第 9 
行 之 闻 将 Y 时 设置 为 寺 ， 或 者 使 用 calloc. 


10.11.3 ЛИ Н 

正如 我 们 在 3.13 Be ORE SIN. ШЕ МАРТИ А УЛЛУ ЛВ) Н 
х, HUAIXTORPRELACR АЙЫН ӨНЕ (buffer overflow bug), Phu. РАВА tB 
ұ, RA gets Е ЛЕКА ИХ. ДЕНЕА ШЕ, Я А fgets 函数 ， 
ЛА А КА: 


1 


-] &n қыл e М [мы 


void bufoverflow(] 


[ 


J 


char puf[54'; 


gets(buf); Æ here is the stack buffer overflow bug */ 
return; 


10.11.4 假设 指针 和 它们 指向 的 对 象 是 相同 大 小 的 
一 种 常见 的 错误 是 假设 指向 对 象 的 指针 和 它们 所 指向 的 对 象 是 相同 大 小 的 ， 


1 /*Crëatëe an nxm array */ 

2 int **makeArrayl(int n, int m) 

3 L 

4 int 1; 

Б int **A = [int **)Malloc(n * sizeofíint!]; 
b 

7 for (1 = Ü; 1 < N; i++) 
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B A[1] = ftint *iMallocím + sizeofí(int)); 
9 return А; 
10 ) 


这 里 的 虽 攀 是 创建 一 个 和 由 天 个 指针 组 成 的 数组 ， 每 个 指针 都 指 同一 个 怎 售 m A int 的 数组 。 然 
人 而， 因为 程序 员 在 第 5 行将 sizeoffjnt 和 写成 了 sizeoflinty， 人 代码 实际 创建 的 是 一 个 таг HRA. RE 
代码 只 有 在 int 和 指向 mt 的 指针 大 小 相 门 的 机 器 上 运行 良好 。 

НЕ, ШАЛЫН Alpha 这 样 的 机 器 上 运行 这 段 代 码 ， 其 中 指针 大 于 int， 那 么 第 ?了 (TRUE S 
有 的 德 环 将 号 到 超出 各 数组 未 问 的 地 方 。 因 为 这 些 字 中 的 一 个 很 可 能 是 已 分 配 块 的 边界 标记 和 糊 部 ， 
所 以 我 们 可 能 不 会 发 现 这 个 销 误 ， 语 到 我 们 在 这 个 程序 钓 后 徊 很 六 释放 这 个 所 时 ， 此 时 ， 分 配器 中 
内 合 开 代码 会 戏剧 性 地 失败 ， 而 没有 任何 明显 的 原因 。 这 是 “在 反 处 起 作用 (action at distance)" ËJ 
个 阴险 示例 ， 这 类 “在 远 处 起 作用 ” 吓 与 存储 器 有 关 的 编程 错误 狗 典 型 情况 ， 


10.11.5 造成 错位 错误 
tv COff-by-one). БЕКЕН BUE. ИЕ BR AE М: 


1 /* Create an nxm атау */ 


2 int **makeAàrray2,.int n, int m) 

2 | 

а “Nt ij 

5 int **A = [int **jMallociín * sizeof(íint]); 
6 

7 tor (1 = D; 1 <= n; 1++} 

: А[11 = (int *iMallocím * sizeof'int)): 
9 return А; 


10 1 


iX Rein — ЕВР ^T NUR. ВИИ STUET 个 个 元 素 的 指针 数组 ， 但 是 
随后 在 第 了 行 和 第 8 行 试图 初始 化 这 个 数组 的 ned 个 元 素 , 在 这 个 过 程 中 覆盖 了 A 数组 后 面 的 其 个 


10.11.6 引用 指针 ， 而 不 是 它 所 指向 的 对 象 

如 未 我 们 不 太 注意 安 操 作 符 的 优先 级 和 结合 性 ， 我 们 就 会 错误 地 操作 指针 ， 而 不 是 期 户 提 作 指 
针 所 指 同 的 对 象 。 比 如 ， 考虑 卜 面 的 函数 ， 其 目的 是 删除 一 个 有 *size 项 的 一 叉 堆 里 的 第 一 不 ， 然 后 
对 剩 卜 的 #size-] 项 重新 建 堆 ， 
int *binheapDele-e(int **binheap, int *size) 
{ 

int *packet = binheap[0]; 


binheap[O0] = binheap[*size - 1]; 
*size--; /ff*this should be (*size)-- */ 
heapiEy(binheap, *size, Qi; 
returnípacket): 


) 
在 第 3 行 ， 晶 的 是 减少 size 指针 指向 的 整数 的 值 Cb ak ЕЛ ECssize)--), ЖА, 25 —26-- 


w G —] тап назы DEB be 


В d 655 


Bi* АЯНА СОНА, MARTES, MAZ oiT RARER АЕТ SON. ПАШ 
кН ШЕ ТИН. Ree. BEFASI, АА В РАВНЕ Е, МЕНЕН 
AITE Л EB -TA ERRA ЖН. ВА ААИ: HUDS Г. pH n m ul e an 
ХЕЛЕН, ЖАНА 5. ЕШ, 63064, 我 们 可 以 清晰 地 表示 我 们 的 目的 ， 便 用 
SOC size)- -. 


10117 误解 指针 运算 

另 -- 种 常见 的 错误 是 忘记 了 指针 的 算术 操作 是 以 它们 指向 的 对 象 的 大 小 为 单位 来 进行 的 ， 而 这 
种 大 小 单位 并 不 一 定 是 字 季 。 例 如 ， 下 和 面 函 数 的 日 的 是 扫描 一 个 int 的 数组 ， 并 返回 一 个 指针 ， 指 
[B] val 的 首次 出 更 ; 


1 int *searchíint Яр, int val) 

2 [ 

3 while (*p && *p іш val; 

4 p += sizeof(int]; /*should be p++ */ 
D return p; 

б ) 


ЖАП, AARAA, ЖАЛАМЕН А CT REBEIIEE ORO HERCULES EH ELEC 
组 中 每 4 个 整数 ， 


10118 引用 不 存在 的 变量 
没有 六 多 经 验 的 C 程序 员 椒 理解 栈 的 规则 ， 有 时 会 引用 不 下 合法 的 本 地 变量 ， 如 下 列 所 示 : 
int *stackref f) 


{ 


int val; 


1 
2 
j 
4 
5 return &val; 
is 


} 

这 个 函数 返回 - -个 指针 《比如 党 是 p)， 指 向 栈 里 的 一 个 局 部 变量 ， 然 后 弹出 它 的 栈 帧 。 尽 管 p 
仍然 指向 - :个 合法 的 存储 器 地 址 ， 但 是 它 已 经 不 再 指向 一 个 合法 的 变量 了 。 当 以 后 在 程序 中 调用 其 
他 尖 数 时 ， 存 储 器 将 重用 它们 的 栈 帧 。 后 来 ， 如 果 程 序 分 配 某 个 值 给 rp， 那 么 它 可 能 实际 让 在 修改 
另 一 个 函数 的 栈 帧 中 的 一 个 条 目 ， 从 而 带 来 潜在 地 灾难 性 的 、 令 人 困惑 的 后 果 。 

10.11.9 引用 空闲 堆 块 中 的 数据 


一 个 相似 的 错误 是 引用 已 经 被 释放 了 的 堆 读 中 的 数据 例如 ， 考 妃 下 面 的 示例 ， 这 个 示例 在 第 
6 行 分 配 了 一 个 整数 数组 x， 在 第 12 行 先 释放 了 块 x， 然 后 在 第 14 行 又 引用 了 它 。 


1 int *heaprefiint n, int m) 

2 { 

3 int 1; 

4 int %х, %у; 

5 

6 x = (int *)Fallociín * sizeofiint)); 
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7 
8 ж... f {* other calls іс malloc and free go here */ 

9 

10 ігге(хі; 

11 

12 y = (int *)Mallocim * sizeofíint!); 

13 for {1 = D: 1 < m; i++! 

14 Bn = x[i]++;  #* oops! x[i] is a word in a free block */ 
15 

16 return y; 

17 } 


МЕРТ ОТ 10 行 发 生 的 malloc 和 free 的 调用 模式 ， 当 程序 在 第 14 行 引 用 ДЕ, X 
妈 X 吕 能 是 其 个 其 他 已 分 配 堆 块 的 一 部 分 了 ， 因 此 其 内 容 被 重 写 了 。 各 其 他 许多 与 在 储 器 有 关 的 铬 
误 - “ 样 ， 这 个 错误 内 会 在 程序 执行 的 后 和 看， 当 我 们 注意 到 Y 中 的 值 被 破坏 了 时 ， 才 会 时 现 出 来 。 


10.11.10 51е 
ТИ ЕЛ НВ. ЕНІ, SERRATA bmi ЕД ИЛАШ. ТЕН T ҺОМ, 
о НЕ К [ар БШ. РАЈА А Г ТЕШ x. ADAC EAD. 
void leakíint mn) 
| 


int *x = [int *)]Mallocíin * sizeoflíint]]); 


] 
4 
1 
4 
5 return;  /*xis garbage at this point */ 
б 


) 


如 果 leak ЕРЕН, ЖАЯЫН, EE ES Ы, BERRET. сан Ж E 
地 址 定 间 。 间 于 像 守 扩 进 程 和 服务 器 这 样 的 程序 米 说 ， 存 储 器 泄漏 是 特 淹 闫 重 的 ， 根 据 定 义 这 些 程 
序 是 不 会 终止 的 。 


10.12 扼要 重 述 一 些 有 关 虚 拟 存储 器 的 关键 概念 


在 这 一 章 里 ， 我 们 已 经 看 到 了 虚拟 存储 器 是 如 何 工作 的 ， 系 统 如 何 用 它 来 实现 某 些 功 能 ， 例 如 
加 载 程序 、 映 射 共享 库 以 及 为 进程 提供 私有 受 保护 的 地 址 空间 。 我 们 还 看 到 了 许多 应 用 程序 正确 或 
普 不 正确 地 恒 用 虚拟 存储 器 的 方式 。 

“个头 键 的 经 验 教 训 是 ， 即 使 虚拟 存储 器 是 由 系统 自动 提供 的 , 它 也 是 :种 有 限 的 存储 器 资源 ， 
应 用 程序 必须 精明 地 管理 它 。 止 如 我 们 从 对 动态 存储 分 配器 的 研究 中 学 到 的 那样 ， 管 理 虚 拟 存 储 器 
资源 可 能 包 掺 一 些微 妙 的 时 间 和 空间 的 平衡 。 另 一 个 关键 的 经 验 教 训 是 ， 刘 CC 和 序 中 很 容易 犯 与 存 
赃 瘟 有 关 的 错误 。 坏 的 指针 值 、 宏 放 已 经 空间 了 的 块 、 不 恰当 的 强制 类 型 转换 和 指针 运算 ， 以 及 覆 
番 扒 络 构 ， 这 些 只 是 可 能 给 我 们 带 来 麻烦 的 许多 方式 中 前 - -小 部 分 。 袜 际 上 ， riks KB AA 
КЕСІК, ЖЕЗ Java 产生 的 一 个 重要 原因 ，Java 取消 了 取 变 量 地 址 的 能 力 ， 完 全 玉 制 了 动态 存储 
AH ROSE. Mato? Seoul TS E HELP A REST RT 


БАЯ 657 


10.13 h 


虚拟 存储 器 是 对 主 存 的 一 个 抽象 。 支 持 虚 拟 存 储 器 的 处 理 器 通过 使 用 一 种 叫做 虚 氢 寻 址 的 间接 
形式 来 引用 主 存 。 椒 理 器 产生 一 个 虚拟 地 址 ， 在 被 发 送 到 主 存 之 前 ， 这 个 地 址 坡 翻 伴 成 一 个 物理 地 
址 。 从 虚拟 地 址 空间 到 物理 地 址 空间 的 好 址 翻译 要 求 硬 件 积 软件 紧密 合作 。 专 让 的 硬件 通过 使 用 商 
表 来 翻 详 虚 所 地 址 ， 而 页 表 的 内 容 是 由 操作 系统 提供 的 。 

虚拟 仓储 器 提供 三 个 重要 的 内 能 。 第 一 ， 它 在 主 存 中 自动 缓存 最 近 使 用 的 存放 磁 栖 上 的 虚拟 地 
进 衬 间 前 内 容 。 凑 拟 存储 器 缓存 中 的 块 叫做 页 ， 对 磁 瘟 上 员 的 引用 会 触发 缺 页 ， 缺 页 将 控制 转移 到 
拘 作 系统 中 的 一 个 缺 责 处 理 程序 。 缺 资 处 理 程序 将 页 面 从 蔽 盘 拷 贝 到 主 存 缓存 ， 如 果 岂 要 ， 将 写 同 
似 斐 乏 的 页 。 第 二 ， 虚 拟 仓 傅 器 简化 了 存 情 器 管理 ， 进 而 又 俏 化 了 链接 、 坦 进程 间 共 识 数 据 、 进 程 
的 存储 器 分 配 ， 以 及 程序 加载。 最后， 虚拟 存储 器 通过 在 每 条 页 表 条 卓 中 加 入 保护 位 ， 从 而 了 简化 
f iba ыы 

ИИГЕН ДА ЖЕНЕШЕ HR II h Ph E Sp r E. ХФИЛЖЕНЕҒІЛ БОЁ 
缓存 中 ,但 是 一 个 称 为 TLB ЖАНАА Em EXEAT. OS SERI E L Eg 
的 开销 。 

现代 系统 通过 将 虚拟 仓储 器 组 块 (chunk) 和 磁盘 上 的 文件 组 块头 联 起 来 , 来 初始 化 虚拟 存储 器 
组 块 ， 这 个 过 程 称 为 位 坟 避 映射 。 存 情 器 映射 为 共享 数据 、 创 建新 的 进程 以 及 加 载 程序 ， 担 供 了 -- 
Tr ERO ML). ЛУ GT ELE RH] mmap 函数 来 手工 地 创建 和 删除 患 拟 地 址 空间 的 区 域 。 然 而 ， 大 客 数 
程序 依赖 于 动态 存 幅 器 分 配器 ， 例 如 malloe， 它 管理 虚拟 地 址 空间 区 域内 一 个 称 为 堆 的 区 域 。 动 态 
仔 情 器 分 配器 是 一 个 有 系统 级 感觉 的 应 用 级 程序 , 它 直接 操作 存储 器 , 而 无 需 类 型 系统 的 很 多 帮助 。 
分 配器 有 关 种 类 型 ， 显 式 分 配器 要 求 应 用 显 式 地 宏 放 它们 的 存储 器 据 ， 隐 式 分 配器 (垃圾 收集 器 》 
日 动 释 放任 何 无 用 的 和 不 可 达 的 块 . 

对 于 C 程序 员 来 说 ， 管 理 和 使 用 虚拟 存储 器 是 一 件 困 难 和 容易 出 错 的 任务 。 常 见 的 错误 示例 包 
hh: 辐 接 引用 坏 指针 ， 候 到 未 初始 化 的 存储 器 ， 人 允许 栈 组 冲 区 溢出 ， 假 设 指针 和 它们 指向 的 对 氮 大 
小 相同 ， 直 用 指针 而 不 是 它 所 指向 的 对 象 ， 误 解 指针 运算 ， 引 用 不 存在 的 变量 ， 以 及 引起 存储 器 泄 
8. 


参考 文献 说 阴 

Kilburn 和 他 的 同事 们 发 表 了 关于 虚拟 存储 器 的 第 一 篇 描述 [42]。 体 系 结构 教科 书包 丘 关 于 全 性 
企 虚 氢 存 傅 器 中 的 角色 的 额外 细节 [33]。 操作 系统 教科 书包 含 关于 操作 系统 角色 的 狼 外 信息 [70, 83. 
751. 

Knuth 在 1968 年 网 写 了 有 关 存 储 分 配 的 经 典 之 作 [43]。 从 都 以 后 ， 在 这 个 领域 就 有 了 大 量 的 文 
BA. Wilson, Johnstone, Neely 和 Roles 编写 了 关于 显 式 分 配器 的 完美 调查 和 性 能 评价 前 文章 [88]， 
本 书 中 关于 各 种 分 配器 策略 的 型 吐 率 和 利用 率 的 - 般 评 价 就 引 自 于 他 们 的 调查 。Jones 和 Lins 提供 
了 诺 于 垃圾 收集 的 全 面 的 讲 查 [37]。Kernighan ЖІ Ritchie[40] 展 示 了 -个 简单 分 配器 的 完整 代码 ， 这 
个 税 单 的 分 配器 是 基于 显 式 空闲 链 末 的 ， 每 个 空闲 氮 中 部 有 一 个 块 大 小 和 后 释 指 针 。 这 段 代码 使 用 
联合 Cumon) 来 消 除 大 量 的 复杂 措 针 运算 ， 这 是 很 有 趣 的 ， 但 是 代价 是 释放 操作 是 线性 时 间 【 而 不 
是 常数 时 间 )， 
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www.cs.colorado.edu/-zorn/DS A.html 上 Zorn 的 Dynamic Storage. АПосапоп Repository (动态 存 
Иа) 是 -个 很 方便 的 资源 。 它 包括 检测 与 存 赃 器 相关 的 错 嵌 的 调试 工 上 内， 以太 malloc/free 
和 垃圾 收集 器 的 实现 。 


家 庭 作业 

1011 % 

fF PIE ӘННЕН, ЕЕ 10.64. T pios P BE ЖАЗДАП КЕ НЕ BE БЕЗИ Ий 
hF, UAE RIT. АҒАНЫҢ, ИШТЕШИШ TLB ЖН. ЖЕНШ, ЖАН 
存 字 节 值 , 请 指明 是 否 TLB 不 命中 , ERRETEN., ВАЕ ГЛЕН. ДАНЯР, 
对 寺 “ 返 回 的 姐 存 字 节 ”用 “-” 来 表 尖 。 如 果 有 缺 责 ， 对 于 “PPN” 用 “-” 来 表示 ， 并 把 部 分 〔C 
HA DATE., 
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C. 物 型 地 址 格式 
І 10 9 8 7 5 5 4 3 2 ] Ü 
D. 物 型 地 址 引用 
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XPT FARI EH 3 10.11: 
ВИНЕ: 0х03а9 
А. EMH 
13 12 |i 10 9 8 7 б 3 4 3 2 ] [ 


B. 地 址 翻译 
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C. 物理 地 址 格式 
11 10 9 8 7 б 5 4 3 2 | 0 
D. 物理 地 圳 引用 
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10.13 € 
对 十 下 向 内 地 址 ， 重 复习 题 10.11: 
ЖАШ: 0x0040 
A. АЕ x 
13 12 П 10 9 & Н б 5 4 3 2 | Ü) 
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МБ” 1 
(YIN?) 


VPN 


ma — [| Е 


ТІВ mt? 


ШЕ 
PPN 





С. 物理 地 址 格式 


AE RISE E H 





10.14 ФФ 

ЕБВ Л CE hello.txt， 由 字符 串 “Hello, wordin” 组 成 。 编 写 — СН. EA mmap 
来 改变 hello.txt 的 内 容 为 “Jello, world in ". 

10.15 % 

确定 下 面 的 таПос ін ЖИ Ф| Ж A RUE ЖИН. 假设 : 分 配器 维持 双 字 对 章 , 使 用 图 10.37 
中 瑞 格 式 的 隐 式 空 闪 链 表 ， 块 大 小 向 上 舍 入 为 最 接近 的 8 字 节 的 倍数 。 


КЕЛГЕН 
in ү р Е 
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Өре ТША Ж ЖЖБИ КЕНТАУ БӨ. АЗЫ. tA ТИШТИ 
V pf] pred 和 succ 指针 ， 不 允许 有 效 载 有 的 大 小 为 零 ， 并 几 头 部 和 脚 部 存放 在 - ' 个 四 字 节 的 字 
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对 章 要 求 =" сй 
ШІШЕСЕТІТ ЕГІ ИШЕ 
[wr | жане |е | 


1017 999 

ЖЖ. 109.12 fir d] АНЫ КЖ, Br P POBRES. mie B ОПЕЙ Ж. 

10,18 %%% 

10.9.12 T TE $r p as CK RET BER АЙЫҢ ВАВ, СЗС SUR ТАЈ ЧУЕ БОК, E 
得 空闲 块 天 要 头 部 和 脚 部 ， 而 已 分 配 块 只 需要 头 部 。 


10.19 % 
下 面 给 出 了 = 组 关于 存储 器 管理 和 垃 报 收集 的 陈述 ， 在 每 一 组 由， 只 有 - -名 陈述 是 正确 竟 。 你 
的 任务 就 是 判断 哪 “名 是 正确 的 。 
l. (a) 在 一 个 伙伴 系统 中 ， 最 高 可 达 $0 名 的 空间 因为 内 部 碎片 而 被 浪费 了 
Cb》 首次 远 配 存储 器 分 配 算法 比 最 位 适 配 算法 要 乙 -- 些 《平均 而 言 》。 
(с) 只 有 当空 闪 链 表 按 照 存 情 器 地 址 递增 排序 时 ， 使 用 边界 标记 来 回收 才 会 快速 。 
(d) 居 伴 系统 只 会 有 内 部 碎片 ， 而 不 会 有 外 部 碎片 。 
2. Са) 在 按照 块 大 小 网 妆 的 顺序 排序 的 空 采 链表 上 , 使 用 首次 适 配 算法 会 导致 分 配 性 能 很 低 ， 
但 是 串 以 避免 外 部 雁 片 。 
(b) 对 于 最 佳 适 配 方法 ， 空 闲 块 链表 应 该 按照 存 情 器 地 址 的 递增 排序 。 
сс) 最 传道 配方 法 选择 请 求 段 虑 配 的 最 大 的 空 附 块 。 
(d) 在 按照 块 大 小 递增 的 顺序 排序 的 空闲 链表 上 ， 使 用 首次 适 生 算法 与 使 用 最 舍 适 配 算 法 等 
(б. 
3. Mark&Sweep 地 地 收集 器 在 卡 列 哪 种 情况 下 叫 依 保守 的 ， 
Ca) 它们 只 有 在 存储 器 请 求 不 能 被 满足 于 才 合 并 被 释放 的 存储 器 。 
(b) 它们 把 ЛЕН АЙНА ЕН. 
(с) 它们 只 在 用 尽 存 储 器 时 ， 才 抉 行 垃圾 收集 ， 
(d) 它们 不 释放 形成 循环 链表 的 存储 器 块 。 
1020 ФФФФ 
编写 你 自己 的 malloc 和 free 版 本 ， 将 它 章 运行 对 间 和 空间 利用 率 与 标准 C 库 提供 的 malloc 版 
本 进行 比较 。 
练习 题 答 案 
练习 题 10.1 答案 
这 志明 让 你 而 不 同 地 址 空间 的 大 小 有 了 些 了 解 ,曾几何时 ,一 个 32 位 地 址 空间 看 上 去 似乎 是 不 
可 能 的 大 。 但是， 现在 有 些 数据 库 和 科学 应 用 害 要 更 大 的 地 址 空间 ， 而 县 你 会 发 现 这 种 趋势 会 继续 。 
在 你 的 有 生 之 年 ， 你 呀 能 会 抱 外 你 的 个 人 电脑 上 那 狭 促 的 64 位 地 址 空间 1 
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# 改 一 的 地 址 (ND 最 大 地 址 


255 = 16384P 29^ — 16384P- | 


练习 题 10.2 ЖЕ 
因为 每 人 虚拟 页 面 是 P =PTH, BUDE Rob BJLG 20^ = 27 ^ SERE, ҢЕР EG 
要 -ARAH (OPTED. 








练习 题 10.3 答案 

^j i 76S ЖЕНЕ, 你 需要 很 好 地 理解 这 类 问题 .下 面 是 站 和 何 解决 第 一 个 子 判 题 ; 我们 有 n=32 
个 虚拟 地 址 位 和 m=24 个 物理 地 址 位 。 页 面 大 小 是 P=1KB， 这 意味 痢 对 于 УРО 和 PPO, ЖІПТЕН 
log(1K)-10 4/2 CHE — F, УРО 和 PPO 是 相同 的 ,) 剩 下 的 好 址 位 分 别 后 VPN A PPN. 











Ою m | we | «| n 
(om | u | n [и 
练习 题 10.4 ЖЖ 
做 一 些 这 样 的 手工 模拟 , 能 很 好 地 巩 回 你 对 击 址 翻译 的 理解 。 你 会 发 现 写 出 地 址 中 的 所 有 的 售 ， 
fe GIBT EE EBORE, Pia VPN. TLBI 等 等 ， 这 会 很 有 帮助 ， 在 这 个 特殊 的 绑 习 中 ， 
没有 任何 类 型 的 不 命中 : TLB 有 一 份 PTE 的 指 见 ， 形 缓存 有 - - 份 所 请 求 数据 字 的 描 贝 。 对 于 命中 和 


А PR- НАНЫНА, НД 10.11. 10.12 和 10.13. 
А. QO! 0011 1101 0111 






B, VEN: хі 
TLBI: (x3 
ТРТ: Ом 4 
TLB 命中 ? Y 
im N 
PEN: оха 


С. 0011 0101 0111 
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D. CO: Ux 
Cl: 0х5 
CT: Oxa 


mibi бт? Y 
Ж 4T: Ох1а 
练习 题 10.5 答案 
解决 这 个 题 日 将 帮助 你 很 好 地 理解 存储 器 映射 。 请 自己 独立 完成 这 道 题 。 我 们 没有 讨论 open, 
fstat 或 者 write 函数 ， 所 以 你 需要 阅读 它们 的 帮助 页 来 看 看 它们 是 如 和 何 工 作 肥 。 


code/vm/mmapcopv.c 
1 tinclude "csapp.h" 
2 
3 /* 
Д * mmapcopy - uses mmap to copy file Ға бо stdout 
5 */ 
Š vold mmapcopy (int fd, int size) 
7 
8 char *bufp; /* ptr to memory mapped VM area */ 
© 
10 bufp = Mmapi NULL, size, PROT READ, МАР PRIVATE, fd, 0); 
11 Write(l, bufp, size); 
12 return; 
13  ) 
14 
15  /* mmapcopy driver */ 
15 int mainí(int arge, char **argvi| 
17 f 
18 struct sta- stat; 
19 int fd; 
20 
21 /* check for required command line argument */ 
22 if large 1- 2) f 
23 printfí"usage: $s «rilename»n", argví(0]); 
24 ехікій); 
25 | 
25 
27 /* copy the input argument to ѕїсоці */ 
28 fd = Ореп{агач [1], О RDONLY, 0); 
29 tstatí(fd, stat}; 
30 mmapcopyitd, stat.st_size): 
31 ex-ti(i0); 
32 } 
code/vm/mmapcopy.c 
练习 题 10.6 FE 


TERME Г НИ. PIL Sk. МАҚАН; Ы. ЕКА A 
方法 基 , 345185 ЖР ЕА ВОН А О СИЕ s 字 节 ) 最 近 的 整数 倍 。 
EW, malloc(1i8í3K ЖКД 4+1=5, АЕА 18. mf mallocf13 请 求 的 块 大 小 是 13417, 2 
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入 到 24。 


Wo {十进制 字 节 ) | RAR CHARS 
0х9 
Ox1; 


ЕСІГІН | к |o o9 
ЕЛІН | юв ЕНСІН 

练习 题 10.7 答案 

最 小 块 大 小 对 内 部 碎片 有 显著 的 影响 。 因 此 ， 理 解 和 不 同 分 配器 设计 和 和 对齐 要 求 由 关联 的 最 小 
块 大 小 是 很 好 的 。 很 有 技巧 的 -部 分 是 ， 要 意识 到 相同 的 块 可 以 在 不 同时 刻 被 分 本 或 者 被 释放 。 上 因 
此 ， 节 小 吉大 小 就 是 最 小 已 分 配 块 大 小 和 最 小 空闲 氛 估 小 两 者 的 报 大 值 。 例 如 ， 在 节 后 一 个 子 问 题 
中 ， 最 小 的 已 分 屿 块 大 小 中 一 个 4 平 节 涉 部 种 一 个 1 字 节 有 效 载 荷 ， 舍 入 到 8 Е У. ПОЈ 
的 大 小 是 一 个 十 字 节 的 头 融 和 个 4 字 节 的 脚 部 ， 加 起 来 是 8 字 节 ， 已 经 是 8 的 信和 数 ， 就 不 渍 要 再 
合 入 了 。 所 以 ， 这 个 分 配器 的 最小 块 大 小 就 是 8 字 节 ， 








练习 题 10.8 答案 


这 里 设 有 特刊 的 技巧 。 但 是 解 苍 此 题 要 求 你 理解 我 们 简单 的 隐 式 链表 分 配器 的 剩余 部 分 是 如 何 
了 1 作 的 ， 是 如 何 操作 和 和 遍历 块 的 ， 


— codefvnumalloc.c 
1 static void *find fití(size t asize) 
2 1 
3 vold *bp: 
4 
5 /* Lirst fit search */ 
Б Гог ibp = heap listp; GET SIZE(HDRP(bp]) > 0; bp = NEXT BLEP(bp)! { 
? if (СЕТ ALLOCIHDRP(bpi] && (asize <= GET SIZK(iHDRP(bp))H?Y 4 
8 return bp; 
9 ] 
10 ) 
11 return NULE; /* no tit */ 
12 ] 

code/vm/mailoc.c 
练习 题 10.9 ЖЖ 


庆 艾 起 一 小 帮助 你 加 恶 分 配器 的 热身 练习 。 注 意 对 于 这 个 分 本 器， 最 小 去 人 小 是 16 字 节 。 如 果 
分 证 后 莘 邓 的 块 大 于 成 者 等 于 最 小 块 大 小 ， 那 么 我 们 就 分 审 这 个 块 〔 第 6 一 10 £70. 这 时 惟一 有 技巧 
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的 部 分 是 要 意识 到 在 移动 到 下 一 块 之 前 【第 8 行 ) ТОЛЕ ТНУ RO (Ж 6 1) SUR 7 415. 


—— —[uIr— v vcode/vm/malloc.c 
1 static void place(vcid *bp, size_t asize) 
á i 
3 size t csize = СЕТ SIZE(HDRPIbp)): 
Д 
5 if (ісзіге - asize) >= (DSIZE + OVERHEAD)! | 
5 PUT(HDRP(5bpj, БАСЕ(авіге, 1)); 
7 PUT(FTRPÍDp), РАСК lasize, 1}); 
B bp = NEXT BLEP(bp); 
9 PUT(HDRP(íbp), PACK(csize-asize, 0)); 
10 PUT[FTRP(bp), PACK(csize-asize, C)); 
11 j 
12 else 1 
1i PUT {НОВЕ ibp}, РАСКІсвіт?е, 1}); 
14 FPUTIFTRPEibp}, PACK{csize, 1)); 
15 } 
іб } 
code/vin/malloc.c 
练习 题 10.10 答案 


这 里 有 -个 会 引起 外 部 碎片 的 模式 ， 应 用 对 第 一 个 大 小 类 做 大 量 的 分 配 和 释放 请 求 ， 然 后 对 第 
一 修 大 小 类 做 大 量 的 分 配 和 释放 请 求 ， 接 下 来 是 对 第 一 个 大 小 类 做 太 量 的 分 配 释 放 请 求 ， 以 此 类 
推 。 对 于 每 个 人 小 类 ， 分 配器 都 创建 了 许 儿 不 会 被 回收 的 存储 器 ， 因 为 分 配器 不 会 合并 ， 也 内 为 应 
用 不 会 册 辐 这 个 大 小 美 青 次 请 求 块 了。 


EN 
5 
Sore MR 


Я: 3 部 分 
程序 间 的 交互 和 通信 


输入 和 输出 。 然 而 ， 在 现实 世界 里 ， 应 用 程序 利用 操作 系统 提供 的 服务 来 与 


我 们 学 习 计 簿 机 系统 到 现在 ， 一 直 假 设 程序 是 独立 运行 的 ， 只 包含 晤 小 限度 的 
IO 设 瘟 名 其 伯 程 序 通信 。 


APZ- BAHE 7 Unix 操作 系统 提供 的 基本 VO 服务 , 以 及 如 何 用 这 些 


服务 来 构造 应 用 程序 ， 例 如 Web 客户 庙 和 服务 器 ， 它 们 是 通过 Internet 彼此 通信 的 。 


е 写 诸 如 Web ЕХ B9] БВУ MUT ADR 
当 你 学 完了 这 个 部 分 ， 你 将 稳健 步 入 权威 程序 员 的 行列 ， 能 够 充分 理解 计算 机 系 
RURE ХУ ТЕРІНЕ ДЕ» 
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输入 /输出 (11Q) ЕТЕ ЕХ (main memory). #ТУР И Cf bn BS rU D AR. Sin ANRO 7 [B] 
ӨЛШЕМГЕ. WAREM VO ESSERE. ШЕЕ ЖМ, ЕТЕ ИЕТ VOX 
ЖГ 
所 有 庄 言 的 运行 时 系统 都 提供 执行 VO ШИ ЕЈ LB. 例如 ，ANSIC 提供 标准 WO Е, =, 
1$ && printf 和 scanf ХАТТЫ TO ERE. C++ 语言 用 它 的 重 载 操作 符 << СА ) Жо> (ү) 
提供 了 其 羽 的 功能 。 (E Unix 系统 中 ， 是 通过 使 用 由 内 核 提供 的 系统 级 Unix VO 函数 来 实现 这 些 较 
m ПО RKI., АН к. ША O РА ТЕЕ, ТЕ АЕН Unix VO. 那么 
为 什么 还 要 麻烦 地 学 习 Unix IO Ue? 

ТИ Unix UO 将 帮助 你 理解 其 他 的 系统 和 概念， ТО 是 系统 提 作 不 可 或 缺 的 一 部 分 ， 因 此 ,我 
22182 UO 和 上 其 他 系统 概念 之 间 网 循环 信赖 。 便 如 ，LO ЖЕНЕШЕ НАТ Т Л Ж 
关键 的 骨 人 多。 反 过 来 ， 进 竹 创 建 双 在 小 加 进程 间 的 交 件 共享 中 扮演 者 关键 角 人 名。 因此 ， 竖 
真正 理解 НО, ОЛЕИН, ЫЛА. ЖЕ (memory) 结构 、 结 构 链接 和 可 
载 、 进 称 以 及 虚 氟 人 存储 器 的 讨论 中 ， 我 们 已 经 接触 了 vo 的 某 些 方面 。 既 然 你 对 这 些 概 念 
有 了 比较 好 的 型 解 ， 我 们 就 能 闭合 这 个 循 球 ， 喝 加 深入 地 研究 VO. 

* 用 时 你 除了 使 用 Unix VO 以 外 别 无 选择 。 秆 某 些 重要 的 情况 中 ， 便 用 高 级 VO Ж A n] 
В ЛА д. АП, ИЕ UO 闫 没有 提供 谍 取 文件 元 数据 的 方式 ， 这 些 元 数据 世 括 
文件 大小 或 文件 创建 时 间 。 更 有 有 甚 者，LO 库 还 存在 一 些 问 题 ， 使 得 用 它 来 进行 网 络 编程 非 
Wn. 

这 СЕ Б) А ИЯ Unix VO 和 标准 VO H- REZ. H ELI UR rk) C 程序 中 如 何 可 靠 地 使 

HET BR í TEOÀ REPERI AR ЭК, Ж-А] ЕЛМЕН АН ЭА ЕШКІ ЕН. 


11.1 Unix I/O 


一 个 Unix 文件 就 是 一 个 m ТИМЕУ) 
Bo, В” Ве, B, 
所 有 的 VO és. Ял, ЖЕ. 部 被 模型 化 为 文件 ， 而 所 有 的 输入 和 输出 都 被 当 秆 
对 相应 文 必 的 案 和 和 写 米 执行 。 这 种 将 设备 优雅 地 野 射 为 交 件 的 方式 ， 人 允许 Unix 内 核 中 出 一 个 简单 、 
低级 的 应 用 接口 ， 称 为 Unix WYO， 这 使 得 所 有 的 输入 和 输出 都 能 以 - -种 统一 有 一 致 的 方式 来 执行 ; 
e 打开 文件 . es A A C 来 宣 占 它 想 要 访问 :个 IO 设备 。 
A EX 一 个 小 的 非 负 整数 ， 岂 做 描述 将 ， 宅 在 后 线 对 此 文件 的 所有 操作 中 标识 这 个 交 件 。 
кате тиылды Iti Pv FH ERE Ro fex SRTT 
Unix shell 创建 的 每 个 进程 开始 时 都 有 三 个 打开 的 文件， 标准 输入 《描述 符 为 0)、 标 准 
输出 (描述 行为 12 和 标准 错误 (描述 符 为 2)。 头 文件 <unistd.h> 定 六 了 常量 STDIN_FILENO、 
STDOUT FILENO 和 STDERR_FILENO， 它 们 可 用 来 代替 显示 的 描述 符 值 。 
. 改 训 当 前 的 文件 位 置 。 内 核 保持 着 一 人 文件 位 置 上 ， 对 于 每 个 打 寺 文件， 初始 为 0。 这 个 六 
Ау R ДААН etu ЕТ Tr Ёш. ЛУН] ГЕНЕ ШАТ seek НИН, ШАҢНАН 
Ж E) Amb EJ k. 
e gEBX.- УЕВЧЕВЕАУНЕЛ ns0 TETIERE, MOuBDCOS mE à. Ж 
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EH к) ken. 给 定 TUAE m ЕЛЕЙ, 3 Km 时 执行 读 操 作 会 触发 一 个 称 为 
end-of-file (EOF) 的 条 忻 ， 应 用 程序 能 检测 到 这 个 条 件 。 在 次 件 结尾 处 并 没有 明确 的 “EOF 


符号 ”。 
类 但 地 ， 写 探 作 就 是 从 存 情 器 指 贝 ns0 个 字 节 到 一 个 交 御 ， 从 当前 文件 位 置 上 开始 ， 然 
IE k, 


е XAXA, ЧЫН ТА XB BA Ies ЕЖА ИМА BIET. АНА ХЕ 
打开 时 创建 的 数据 结构 ， 并 依 复 描述 符 到 可 芍 得 描述 符 凶 中 ， 以 示 响 应 。 无 论 一 个 进程 因 
为 何 种 原因 终止 时 ， 内 核 都 会 关闭 所 有 打开 的 文件 并 释放 它们 的 存储 器 资源 。 


112 打开 和 关闭 文件 
进程 是 通过 调用 open 函数 来 打开 一 个 已 存在 的 交 件 感 者 创建 一 个 新 文件 的 : 


#include «sys/typez.h- 
#include «sys/stat.h-» 
#lnclude «fontl.h- 


int openlchar *tilename, int flags, mode t mode); 


返回 : 3 K. p AX IPAE, 58009-1, 





open ЮЖО filename 转换 为 一 个 文件 描述 符 ， НЕШЕ Т. XR [UTE RC TEE ЕЕ 
FARRA HARE DRR. flags Z TUER T SERHT BL bn uris] УИ: 

е О RDONLY: RÈ. 

• О WRONLY: HS, 

а O RDWR: TÈTH, 

РШ, КЕНЕ ИН ГЕН p STAT — ПЕЙ CE: 

fd = Open("Foo.txt", о RDONLY, 0); 

flags Фи] PARE — нй # a £ yel у, ЖАННА IESU HSBTER: 

* О CREAT: ЖОЛЫМ, ШЕЕ ЖЕЕ) (truncated) (P) 文 忻 。 

е O TRUNC: 如 于 文 忻 已 经 存在 ， 就 截断 它 ， 

* О APPEND: 在 每 次 写 操作 前 ， 设 置 文件 位 置 到 文件 的 结尾 处 。 

例如 ， 下 向 的 代码 说 明 的 是 如 和 何 打开 - -个 已 存在 文件 ， 并 得 后 面 添加 一 些 数据 ; 

fd = Openi"foo.txt", О WRONLYIO APPEND, 0}; 

mode 参数 指定 了 新 文件 的 访问 权限 位 。 这 些 位 的 符号 名 字 如 图 11.1 Bros. 

作为 上 下 交 的 一 部 分 ， 每 个 进程 部 有 一 个 umask， 它 是 通过 调用 umask 明教 来 设置 的 。 当 进程 
X UE mode 参数 的 open 函数 调用 来 创建 一 个 新 文件 时 ， 文 件 的 沪 问 权限 位 被 设置 为 mode & 
-umasK。 例 如 ， 假 设 我 们 给 定 下 面 的 mode 和 umask RAH: 


*define DEF MODE S, IRUSR|S IWUSR|S IRGRP|S IWGRP|S IROTHIS IWOTH 
*detine DEF UMASK 5 IWGRPIS IWOTH 


EHA (HERO BEREBUDILTT RE 
МНЕ (RAA) 能 够 宇 这 个 文件 
S IXUSR ЕҢ ARO ЕРЛАН 


S (RGRP 拥有 者 所 在 组 的 成 员 楷 散 读 这 个 文件 

S IWGRP | #1 ЕТЕШ RER tš x J {Р 

S IXGRP HAEREA ЛЕНТА К 
S, IROTH Нд СПА Д) Еа T XC 
S IWOTH ЖЕЛЕ Cre ERSAT Ei 
S IXOTH Hu CEERTRE RO ЕН Tr 2 PF 


B IL) 访问 权限 位 





A svs/stat.h "Pt X. 
H PX. РЕАЛЕ TALE. ХЕНИЯН AU SERE. ПЛ ЕЛІН) SER 
EN. 


umask (ПЕЕ UMASK!; 
fd = Opení"foo.txt"', DO CREAT|O TRUNCIO WRONLY, DEF МОРЕ); 


最 后 ， 进 程 通 过 调用 close MARA THO CIE 


&include <опіві а. h> 


int closeíint Ға); 





返回: 若 成 功 则 为 00， 车 出 错 则 为 -1， 


大 团 一 个 已 大 闭 的 揪 述 籽 会 出 错 。 


ЖУ 11.1 

下 面 程序 的 输出 是 什么 ? 

t *incluce "csapp.h" 

2 

3 int mani) 

4 | 

5 int fdl, 142; 

6 

7 Edl = Openi"foo.txt'. 6 RDONLY, 0); 
H Closeifdli; 

9 tdz = Opení("bag.txt', C RDONLY, 0); 
19 printf("fd2 = €din", Ғ42); 

11 #xit (Q) ; 


là | 
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11.3 读 和 各 写 文件 
应 用 程序 是 通过 分 别 调用 teid 和 write 函数 来 执行 输入 和 输出 的 ， 


&include «unistd.h- 


ssize t read[int fd, void *buf, size t n): 


返回 : 落成 巧 副 为 读 的 字 节 数 ， 涛 EOF 则 为 0， 著 出 错 为 -1 


sslze_t writelint fd, const void *buf, slze_t n); 


ig E]: АЛЛЕР K, EANA- 


read PR M ji Т А fd 的 当前 交 件 位 置 拷 贝 至 多 个 字 节 到 存储 器 位 置 buf. BEHE- 表示 一 
Жана, MERR 0 ж БОР, ЕЙ, ЈАНЕЗ АН ТІ. 

write 函数 从 存储 器 位 置 buf 拷贝 至 多 n AFERRA fd 的 当前 文件 位 置 。 图 11.2 展示 了 一 
个 程序 便 用 read 和 write 调用 - 砍 一 个 字 节 地 从 标准 输入 拷贝 到 标准 输出 。 





code/to/cpstdin.c 


1 Éinclude "csapp.h" 

A 

3 int main(í(void) 

4 | 

5 char с 

б 

7 while(Read(STDIN FILENO, Ес, 1) != 0: 
ü Write STLDOUT FILENO, ыс, 1); 

ü exití(0N: 

10 } 


code/To/cpstdin.c 
图 11.2 一 次 一 个 字 节 地 碎 标 准 输 入 接见 到 标准 输出 


通过 调用 jseek 胃 数 ， 应 用 程 字 能 够 显示 地 覆 改 当前 文件 的 位 置 ， 这 部 分 内 容 不 在 我 们 的 讲述 
范围 之 内 。 
Si: ssize і #7 size 1 ВЕТА Я? 

你 可 能 已 经 注意 到 了 、read АЙ — A size t 的 输入 参数 和 一 个 ssize tei HE, MZ NRI 
3 ZETA ЛЖ? вше 1 ҖЖ LA upsigned int, 18556 СОБАК) Ж.Ж int, read 
idu IAE THR, AREA АИ ДЬ, 24 35 ESAE. JA, 
Ж 4—1 的 可 能 性 使 得 read GRRE hE, А.4ОВ 减 小 到 了 2GB, 


在 某 些 情况 下 ，read 和 write EERE ЕИН ЕРЕ KED, AEREA shot count) Ж 
EEN. HA 一 些 原因 ， 会 出 现 这 样 的 情况 ; 

° ШІЫЗЕН EOF. 假设 我 们 淮 备 读 一 个 文件 , 该 立 件 从 当前 立 件 位 置 开 始 只 含有 20 多 个 字 节 ， 

而 我 们 以 50 个 字 节 的 组 块 (chunk) 进行 读 取 。 这 样 -来 ，F- -个 read 返回 的 不 足 值 为 20， 
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此 后 的 read 将 通过 返回 0 发 出 EOF fi 5. 
e 从 终端 读 丈 本 行 。 如 果 打 并 文件 是 与 终端 相关 联 的 【 例 站 ， 键 益 和 显示 器 )， 寺 么 每 个 read 
阴 数 将 一 次 传送 -修文 本 行 ， 返 叫 的 不 趾 值 等 于 文本 行 的 大 小 ， 
* 读 和 写 网 络 付 接 宇 【socket }。 如 昌 打 开 的 文件 对 应 于 网 络 套 接 字 〔12.3.3 节 )， 那 么 内 部 组 
冲 约 上 刘 和 较 长 的 菩 络 延迟 会 引起 read 和 write 返回 不 足 值 ， 对 Unix 管道 (ріре! 调用 read 
ЖІ wifite， 也 有 可 能 出 现 不 足 值 ， 这 种 进程 间 通 信 想 制 不 在 我 位 计 论 的 范围 之 内 。 
实际 上 ， 除 卫 EOF， 当 你 在 该 磁盘 文件 对， 将 不 会 遇 到 和 不足 值 ， 而 且 看 妃 磁 指 文 件 时 ， 也 太 会 
簿 到 不 足 值 。 然 而 ， 如 果 你 想 创 建 健壮 的 【可靠 的 ) 诸如 Web 服务 器 这 样 的 网 络 应 用 ， 上 就 必须 处 理 
HJ МЭН] read 和 write 引起 的 不 忠信， 直到 所 有 需要 的 字 节 都 传送 完毕 。 


11.4 用 Rio 包 进 行 健壮 地 读 和 写 


让 这 一 小 节 蛙 ， 我 们 会 讲述 一 个 UO 包 ， 称 为 Rio (Robust VO, #0 TO) 6, H 852 
你 处 理 上 六 中 岂 述 的 不 是 值 。 在 像 网 络 程序 这 样 容易 出 现 不 足 值 的 应 用 中 ，Rio 包 提 供 了 方便 、 健 
Ей! Ж) O, Rio 提供 “两 类 不 同 的 前 数 ， 

. 无 缓冲 的 给 入 输出 函数 。 这 些 画 数 直接 在 存储 器 和 文件 志 闻 传送 数据 ， 没 有 应 用 级 缓冲， 

它们 对 将 二 进 制 数据 读 写 至 网络 和 从 网 络 读 写 二 进 制 数 据 尤 其 有 用 。 

e 带鱼 冲 的 给 入 二 数 。 这 些 函 数 允 许 你 高 就 弛 从 文件 中 读 取 六 本 行 和 二 进 制 数 据 ， 这 些 文 件 

МА ЕТЕМ ПЕ ҢАР, ЖЫҒА printf 这 样 的 标准 VO НЕМЕНІ. МІН 
nup mE IO 例 程 不 同 ， 带 缓冲 的 Rio АЖЕК ШЕН OTI v 
同一 个 描述 符 上 可 以 被 交错 地 谢 用 。 人 和 例如， 你 可 以 从 一 个 描述 符 中 读 一 些 文本 行 ， 然 后 读 
到 一 些 _ 渤 制 数 据 ， 接 着 由 名 读 取 一 些 文本 行 。 

我 们 提出 Rio 例 程 为 了 天 个 原因 ， 第- :， 在 总 下 来 的 两 章 中 ， 我 们 并 发 的 网 络 应 用 中 使 用 了 它 
Th Ж, ШЫДАМЫН, AA Unix UO 有 更 深入 的 了 和解。 


1141 Rio 的 无 缓冲 的 输入 输出 函数 
通过 调用 rio_readn 和 rio, weiten 函数 ， 应 用 程序 可 以 在 存储 器 和 文件 之 间 直接 传送 数据 。 










#irclude "'csapp.h" 







Sšlze_t rio readn(int fd, void *usrbuf, size t n); 
ssize t rio writeni.nt fd, void *usrbuf, size t n); 


AE: SEK Ú) ЕШ p 3k, Ж EOF 则 为 人 (只 对 по readn 而 言 ) ， 若 出 错 则 为 -1， 


rio readn РАА fd 的 当前 文件 位 置 最 多 传送 个 字 节 到 存储 器 位 置 usrbuf, 2848, 
ro writen £& £t Jf i usrbuf 传送 n 个 字 节 到 描述 符 fd. но read 函数 在 遇 到 EOF 时 只 能 返 同一 个 
DEH. по writen 函数 决 不 会 返回 不 是 值 。 对 问 个 描述 符 ， 可 以 任意 交错 地 调用 rio_readn 和 
rio wrten. 

图 11.3 显示 了 rio_readn Ж по writen КҮНІ, EE, ШІ read 和 write 函数 被 -PME HE 
信号 处 理 程序 的 返 加 中断， 那么 每 个 函数 都 会 手动 地 重启 read 或 write。 为 了 尽 可 能 有 较 好 的 可 移 
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植 性 ， 我 们 允许 被 中 断 的 系统 调用 ， 昌 在 必要 时 重 朋 它们。( 参 见 &.5.4 rh АРН АЯНА 








He 
code/src/csapp.c 
1 S&ize t rio readní(int fd, void *usrbuf, size t n) 
2 { 
3 size t nleft = n; 
4 s8:ze t nread; 
E char *pufp = usrbput: 
s 
7 while (nleft > 0} 1 
8 if ((nread = read(fd, bufp, nleft)!) < Ú) I 
9 if (еггпо == EINTR) /* interrupted by sig handler return */ 
10 nread = ñ; Ї* and call read() арат */ 
11 else 
12 return -1; /* errno set by read() */ 
11 | 
14 else ії inread == Q) 
15 break; /* БОЕ */ 
15 nleft -= nread; 
1? bufp += пгеай; 
18 } 
19 return ín - nleft); /* return >= 0 */ 
ә ] 
code/sre/csapp.c 
code/src/csapp.c 
1 ssgize t rio мгікелііпі fd, void *usrbuf, size t n! 
2 [ 
3 size t nleft = n; 
4 ss1ze_t nwritten; 
5 char *bufp = usrbuf; 
6 
7 while (nleft > 0] d 
8 1f (inwritten = write(fd, bufp, nleft)) <= 0) 1 
9 it (errno == EINTR)  /* interrupted by sig handler return */ 
10 nwritten = Q; /* and call write() again */ 
11 elae 
2 return -1: /* errorno set by write() */ 
i ) 
14 nleft -- nwritten; 
15 bufp += nwrilten; 
1€ } 
17 return n; 
18  ] 





code/srcícsapp.c 


图 11.3 по readn án rio writen 函数 
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11.42 Rio mm RE AL ERI 

ААТ Е УНИТА АЕ) ASC1 公子 本 序列 。 在 Unix 系统 中 ， 换 行 和 CU 7j 
ASCI 个 换行 符 (LF) 相同 ， 数 字 值 为 00a 假 嚼 我 们 鉴 编 写 一 个 程序 来 计算 交 本 文件 中 风 本 行 的 
数量 ,我 们 该 如 何 来 实现 呢 ? 一 种 方法 就 是 用 read 畏 数 训 -次 一 个 字 节 地 从 文件 传送 到 骨 户 存储 器， 
检查 每 个 池上 节 来 查找 换行 符 。 这 个 方法 的 读 点 是 它 的 效率 不 是 很 高 ， 每 读 取 文 件 中 欧 一 个 字 竹 者 要 
KHAA. 

-种 更 好 的 方法 是 调用 包装 《wrapper) В (rio_readlineb), ^ M АЯР А5 
Хт, НИЕ, 会 启动 地 调用 read ERARE., UTREE УАШ udi 
WEEE ООШ 12.5.3 节 中 描述 的 HTTP 057), RAET A rio readn irh 8н, Щ 
Ж rio readnb, tZ M fl rio readlineb ЊЕНИ F3 I i Т T, 


tinclude "сягрр. П" 
void rio reacinitbírio t *rp, int fd): 


iB EJ: X. 
ssize_t r.o_readlineb(rio_r *rp, void *usrbuf, size_t maxlen); 
ssize t rio readnb(rio t *rp, void *usrbuf, size t n); 
返回 : 车 成 荔 则 为 读 的 字 节 数 ， 若 EOF 则 为 0， 若 出 错 则 为 -1。 
每 打开 一 个 摘 述 刊 ， 都 会 调用 rio, readinitb Ж. КЖЕ fd TH: тр 处 的 一 个 类 型 为 no t 
的 该 缓冲 区 联系 起 来 。 
rio_readinitb 指数 从 文件 tp 读 出 一 个 文本 行 〈( 包 括 结 尾 的 换行 符 )， 将 恬 捍 由 到 存储 器 位 置 
usrbuf, ЛЕЙ null CF) 字符 来 结束 这 个 文本 行 ，frio_Teadinitb 函数 最 多 读 maxen- 个 字 节 ， 余 下 
的 一 人 小字 符 留 给 结尾 的 空 字符 。 超 过 maxlen-! 字 节 的 文本 行 被 截断 ， 并 用 一 个 空 字符 结束 。 
rio readnb 函数 从 文件 tp 最 多 读 n + BARES e u BL usrbuf. 对 同一 描述 符 , 对 по readlineb 
$E го reada КЮН KAS Kir. тп, АНАР АЖ LLL RUS ah u 
rio, readn 5 YE Н. 


МОРЕ Я Р BJ 36 32 rila КЕИ Rio 函数 的 示例 ,图 114 FG T Bn fe ë Rio ЖЖЖ -次 
АИА ИЛ -个 文本 文件 到 标准 输出 。 
codefia/cpfile.c 
*include "csapp.h" 


1 

2 

3 int main(int агас, char **argv) 
4 l 

5 int ^; 

6 rio E rio; 

7 char buf[MAXLINE!; 

Я 

9 

1 


Rio,readinitbí(&rio, STDIN ҒІҺЕМО); 
Ü while((n = Rio_readlinebigrio, buf, MAXLINE)! != Q) 
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11 Rio writerí(STDOUT FILENO, buf, n); 


code/to/cpfile.c 
ПА 从 标准 输入 搁 贝 一 个 文本 文件 到 标准 输出 


图 11.5 展 杰 了 一 个 读 缀 冲 区 的 格式 ， 以 及 初始 化 它 的 rio_readinith 月 数 的 代码 。rio_readinitb в 
数 创 建 了 一 个 空 的 读 疆 部 区， 并 且 将 一 个 打开 的 文件 换 述 符 和 这 个 缓冲 区 联系 起 来 。 
Rož TAR DERI L6 Hrio_read AK. rio. read tK S EE Unix readrA КТЕ ЛЕ НУЫ Ж. 





code/include/csapp.h 
1 кдеТіпе RIO BUFSIZE 8192 
2 typedef struct f 
3 int rio Ға; /* descriptor for this internal buf */ 
4 int rio cnt; /* unread bytes in internal buf */ 
5 char *rio bufptr; /* next unread byte in internal but */ 
6 char rio_buf [RIO _BUFSIZE]: /* internal buffer */ 
7 ) rio t; 
cade/ include /csapp.h 
codef/src/csapp.c 
1 void rio readinitbiírio t *rp, int Fd) 
2 { 
3 rp-»rio fd = td; 
4 rp-»rio cnt = 0; 
5 гр->гіс bufptr = rp-»rio buf; 
Š } 
code/srefesapp.c 
图 11.5 一 个 类 型 为 rio_+ 的 读经 冲 区 和 初始 化 它 的 rio. readinitb ЖЖ 
code/srce/csapp.c 
1 static ssize t rio readí(rio t *rp, char *usrouf, size - n) 
2 | 
3 int cnt; 
4 | 
5 while Irp->rio_cnt <= 0) ( /*refillif buf is empty */ 
Б rp->rlo_cnt = readí(rp-»rio, fd, rp-»rio, buf, 
7 sizeofí(rp-»rio buf)); 
a if ігр->гіс cnt < D) í 
3 if {errno !- EINTR) A interrupted by sig handler return */ 
10 return -1; 
11 | 
12 else if (rp-»rio cnt == 0) #* EOF */ 
13 return 0: 
14 сае 
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15 rp-»rio bEufp:r = rp->rio_buf; /*reset buffer ptr */ 
16 | 

17 

18 /* Сору minin, rp-»rio cnt)bytes from internal buf to user buf */ 
19 cnt = n; 

20 lf (rp-»rio спі < n) 

2 _ cnt = rp-»rio cnt; 

22 memcpy tusrbuf, rp-»rio bvfptr, cnt); 

23 үо->ғіс bufptr += cnt: 

24 r2-»rio cnt -= cnt; 

2^5 return спі; 

28-1 


code/srcícsapp.c 
图 11,6 [AB по read EE 


当 调 用 го read 要 求 读 n 个 字 节 时 ， 读 缓冲 区 内 有 p-ro ent AREZ 17. BER. 
奢 么 会 道 过 调用 read 丹 次 填充 它 。 这 个 read 调用 收 到 一 人 不 足 值 并 不 是 错误 , НАЛЕ РК АЙ 
HRS. HRPE, по read 就 从 读 缓冲 区 将 见 n A rp-»rio cnt PE] ASE VCI Р 
冲 区 ， 并 返回 拷贝 的 字 节 数 。 

HF 一 个 应 用 程序 ，rio_read 函数 和 Unix read 前 数 有 同样 的 语义 。 在 出 错 半 ， 它 返回 值 -1， 并 
HEERE erno. 在 EOF 内， 它 返回 值 4.、 如 昌 要 求 的 字 节 数 超过 了 该 缓冲 区 内 林 读 的 字 节 的 数 
量 ， 瑟 会 退回 一 个 不 是 但。 两 个 明 数 的 相 私 性 使 得 很 宅 易 通过 用 по read 代替 read 来 创建 不 间 类 型 
的 带 组 神 的 读 消 数 。 例如 ， 用 rio read 代替 read. 图 11.7 中 的 rio_readnb 函数 和 rio_readn 有 相同 的 
结构 。 相 似 地 ， 图 11.7 中 的 rio_readlineb 程序 最 多谢 用 rio. read maxlen-1 次 。 每 次 调用 郁 从 读 缓 溃 
区 返回 -个 宁 节 ， 然 后 会 检 但 这 个 字 节 是 否 是 结尾 的 换行 符 。 





code/sre/csapp.c 


1 s8lze_t rio readlinebi(írio t *rp, void *usrbuf, Size t maxlen) 
2 1 

3 añt n, rc; 

4 char с, *bufp = usrkuf; 

5 

б ісі in = l; n < naxlen; п++) | 

7 1Ë [irc = rio геад (тр, кс, 1)) == 1) f 

8 *þufp++ = c: 

9 1Ё (c == 'Mn'! 

10 break; 

1: t else 1f (rz == GY 1 

12 if (n == 1) 

13 return 0; Ё EOF, по data read */ 

13 else 

15 break; /* EOF, some data was read */ 


15 } else 
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17 return -1; Ж eror */ 

18 } 

19 *bufp = 0; 

20 return n; 

21 h 
code/src/csapp.c 
code/sre/esapp.c 

] ssize t rio readnbirio.t *rp, void *usrbuf, size t mn] 

2 I 

3 size t nleft = n; 

4 ssize t nread; 

5 char *bufp = usrbut; 

É 

7 while inleft > 0) 1 

8 if ((nread = rio геадігр, bufp, nlefti) < 0) { 

9 if {errno == EINTR) /* mterrupted by sig handler return */ 

10 nread = 0; {* call read() again */ 

11 else 

12 return -1; /* erro set by read() */ 

13 ) 

14 else if ínread == 01 

15 break; /* EOF */ 

16 nleft -- nread; 

17 Dufp += nread; 

18 | 

19 return іп - nleft); /* return >= () */ 

20 } 


code/src/csapp.c 


图 11.7 ño readlineb йо readnb A% 


Sut. Rio Gig 

Rio йе Хб h + W. Richard Stevens AEA ER I ЗАЛ КЕ S [8 ] P ЖЕ) readline, readn 
和 writen 84, rio readn # по writen dk 5 Stevens 的 readn 和 writen JE — E, M, Stevens 
的 readline 函数 有 一些 限 制 在 Rio ФИЯ ТРЕ. Ж-, у radie АЖИЯН, теа 3%, Я 
以 这 两 个 画 娄 不 能 在 同一 描述 特 上 一 起 使 用 。 X —, О-ДА IE, Stevens 的 readline 
ЗИЛАН, AARE Stevens 引入 一 个 不 同 的 线程 安全 版 本 ， 称 为 readline г, 我们 已 经 在 
rio, readlineb 和 rio readn 函 圾 中 修改 了 这 两 本 扶 陪 ， 使 得 这 两 本 二 数 是 相互 兼容 和 线程 所 安 全 的 。 


11.5” 读 取 文 件 元 数据 
hv Ri fe PF BE 82 AGBA stat 和 fstat 函数 ， 检 索 到 关于 文件 的 信息 【〈 有 时 也 称 为 文件 的 元 豆 据 ， 


metadata). 
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Жігсіліде «unistd,hz 


tinclude «sys/stat.h- 


int аг {сопе char *filename, struc- stat ҰРАР); 
int fstatí(int Ға, struct stat *buf!; 


返回 ; Жж] 0, Eid 5-1. 


stat AR МЭСЕ IE dL А. 并 填写 如 图 11.8 所 示 的 一 个 stat 数据 结构 中 的 各 个 成 员 。 [stat 
革 数 足 相 似 的 ， 只 不过 是 己 交 件 搬运 符 而 不 是 六 性 名 作为 输入 。 当 我 们 在 12.5 竹中 讨论 Web 服务 
Ж, 3E stat 数据 结构 中 此 st mode 和 st size 成 员 ， 其 他 成 员 则 不 在 我 们 的 讨论 之 麟 。 


statbuf.htinchludeed by sys/stath) 
/* Metadata returned bv the stat and fstat functions */ 
struct stat | 


dev t st dev; /* device */ 

ino t at l1no: /* inode */ 

mode t st mode: /* protection and file type */ 
nlink t st nlink; /* number of hard links */ 

uid t St uld: /* user ID of owner */ 

gid t st gid; /^* group ID otf owner */ 

dev t st rdev; /* device type 111 inode device) */ 
оғ І at size; /* total size, іг bytes %; 
unsigned long st БІКбіуе; /* blocksize for filesystem Т/С */ 
unsigned long st blocks: /^* nunber of blocks allocated */ 
time t st atime; /* tine cf last access */ 

Lime t at mtime; /* tine cf last modification */ 
time t s- ctime; /* time of last change */ 





siatbuj.h(includeed by sys/stath) 
图 11.8 stat 数据 结构 


st size MARA TLRF IRA Da st mode 成 员 则 编码 了 文件 访问 许可 位 (图 111) Fix. 
HAST. Unix 识 刘 大 量 不 网 的 文件 类 型 。 普 通 文 件 包 括 某 种 类 型 的 二 进 制 或 文本 数据 。 对 于 内 核 而 
吾 ， 文 本 文件 和 二 进 制 文件 毫 无 区 别 。 习 录 文 件 包 售 关 于 其 他 文件 的 信息 。 套 接 字 是 -- 种 用 来 通过 
草 络 与 其 他 进程 通信 的 文 侍 。 
Unix 提供 的 宏 指令 根据 st mode 成 员 来 确定 文件 的 类 型 图 11.9 列 出 了 这 些 宏 的 一 个 了 集 。 


图 11.9 根据 针 тосе 位 确定 文件 类 型 的 宏 指 令 










在 sys/stat.h T gg V. 
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图 11.10 展示 了 我 们 会 如 何 使 用 这 地 宏和 stat ЖЖ, ЖЕЛЕ — АУЫ mode 位 。 


codeiio/staicheck.e 


1 finclude "csapp.h" 

2 

3 int тајп (int агас, char **argy) 

4 l 

5 struct stat stat; 

Б char *type, *readok; 

, 

8 Statí(íarqv[1], stat): 

9 if (8 ISRES[(Stat.st model) ж Determine file type */ 
16 сурв = "regular"; 

11 elss if [E ISDIRistat.st model) 

12 type = "directory"; 

13 alse 

14 сүре = "other"; 

15 itf (istat.st mode & S_TRUSR)) ХЕ Check read access */ 
16 readok = "yes"; 

17 alse 

18 readok = "по"; 

19 

20 printf("type: %s, read: *sin", type, readok); 
21 ех1Ё{0); 

22 | 


code/fio/statcheck.c 


ТЛО 查询 和 处 理 一 个 文件 的 st mode fy 
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可 以 用 许多 不 同 的 方式 来 天 学 Unix 文件 。 除 非 你 很 清楚 内 核 是 如 何 表 未 打开 的 文件 ,否则 文件 
共 旦 的 概念 相当 难 懈 。 内 转 用 三 种 相关 的 数据 结构 来 表示 打开 的 文件 : 

е 档 述 蔡 才 【descriptortable )。 每 个 进程 都 有 它 独立 的 描述 符 表 ,， 它 的 表 项 是 由 进程 打开 的 文 
件 描 述 符 来 索引 的 。 每 个 打开 的 描述 符 表 项 指向 文件 表 中 的 一 个 表 项 。 

е 文件 表 (е table)。 打 并 文件 的 集合 是 由 一 张 文 件 表 来 表示 的 ， 所 有 的 进程 共享 这 张 表 。 
每 个 文件 表 的 表 项 组 成 《针对 我 们 的 日 的 ) 包括 有 当前 的 文件 位 置 、 引 用 计数 《【〈reference 
count》 即 当前 指 问 读 表 项 的 描述 符 吉 项 数 ， 以 及 一 个 指向 y-node 束 中 对 应 表 项 的 指针 。 关 
肝 一 个 描述 符 会 减少 相应 的 文件 表 表 项 中 的 引用 计数 。 内 核 不 会 删除 这 个 文件 表 表 项 ， 直 
sims REO. 

° у-лойе Ж. (y-node table). АЈ: FE, ВИЛ ЖА vnode 表 。 每 个 表 项 包含 
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stat i Jr e Amd HER. Bd st_mode 和 st size В. 
图 11.11 RRT Pen КРАЖА 1 和 4 通过 不 同 的 打开 交尾 表 表 项 来 引用 两 个 不 同 的 实 
fe AE ARERR AGk, PHF REEE AA. 


HERR JN H Y V-node Æ 
"每 个 进程 ЖА) CBUR ERE HS TO (MARHE 2) 
文件 A 





TRE 


stdin 10 0 | 
stdout 人 各 
9Tderr A 


EIL 典型 的 打开 文件 的 内 核 数 据 结构 
在 这 个 示例 中 ， 两 个 描述 符 引 用 不 同 的 文件 ， 没 有 共享 . 


ME 11.12 所 小， 多 个 据 述 符 也 可 以 通过 涉 问 的 交 件 表 表 项 来 引 用 同一 个 文件 。 例 如 ， 如 果 以 
同 Ж Н open RAAK, 号 会 发 生 这 种 情况 , 关键 思想 是 每 个 拱 述 符 部 有 它 自己 的 文件 位 
Bo МАДА МЕНЕ ТИЕ ВЕТЕР А А ХЕ АНУ ВЕСА А. 










АЖЕ 打开 文件 去 VY-node 点 

(ФРИ K) (МӘННЕН) (НЕДІ) 
_— ТА 

00... ЕЗІ 

ld! ТЕШЕ | 

id2| шалы 

id 3 refent=1 кед 

fd 4 : ' 





文件 位 置 


тёЁСПЕ = 1 





图 11.12 xim 
AJ Гк АНА W T] ОСЕ А а] А Е. 


找 们 也 能 理解 父 了 进程 是 如 何 共享 交 件 的 。 假设 在 调用 fork LAD CRRA ЕН 11.11 Вт 
打开 文件 。 这 时 ， 图 11.13 ГИЙ fork 后 的 情况 ， 

子 进 程 有 一 个 多 进程 描述 符 表 的 剖 本 。 父 子 进程 共享 相同 的 打开 文件 表 集 合 ， 因 此 此 学 相 癌 的 
文件 位 置 。 -个 很 重要 的 结果 就 是 ， 在 内 核 铀 除 相应 文件 表 表 项 之 前 ， 父 节 进 程 必须 者 关 团 了 它 作 | 
的 描述 符 。 
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HENE TE t 
(所 有 进程 共享 ) 

SERIE AIFA 
d 


\ 






x ËB 


а 


h 
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V-node Ж 
{所 有 进程 共享 ) 


文件 访问 | 
ЖЕК 





图 11.13 子 进程 如 何 继 承 父 进 程 的 打开 文件 


初 四 状态 如 昌 11.11 所 示 。 
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БАША X UP foobar.txt | 6 Л ASCI 码 字 料 “foobar” 组 成 。 那 么 ， 下 列 程序 的 输出 是 什么 ? 


1 Kinclude "csapp.h" 

2 

3 int mainí! 

1 { 

5 int fdl, fà2; 

5 сһаг с; 

7 

3 Id] = Opení("foobar.txt", O RDONLY, 
: fC2 = Openi("foooar.txt'", O RDONLY, 
10 Read(idl, &c, 1); 

11 Read(fd2, «с, 1); 

12 printfí(í"c = *cin", c); 

13 exit(0]; 

l4  ) 

练习 是 11.3 


就 像 前 面 那样 ， 候 设 磁盘 文件 foobartxt 由 6 个 ASCH 85334 “foobar” HA.. 


输出 是 什么 ? 


finclude "'csspp.h" 


1 

д 

3 int mainíi 
1 { 


0); 
0); 


那么 下 列 程序 的 
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2 int £6; 

Š char с; 

d 

H Та = Openi"loobar.txt", O RDONLY, 0); 
9 if (Когк() == Ü} Í 

10 Read (fd, sc, 1); 
11 ех11.{0); 

12 ) 

tå WaltiNULL!; 

lá Read (ftd, kg, 1); 

15 printfí"c = %сап”, с); 
18 exit (0); 

1: | 


117 ПО 重 定 向 
Unix shell ЖТ UO 重 定 向 操作 符 ， 多 许 用 万 将 琵 盘 文件 和 林 状 输入 和 输出 联系 起 炒 。 例 如 ， 键 入 


Unix» ің > foo.txt 


使 得 shell 加 载 和 执行 1s ЖР, ЖАНЫН Roa 6] $E S ЖР foo.txt. i bio 48 12,5 节 中 看 到 
的 那样 ， 妆 -个 МВ ЖЕН АІ CGI БЫ, ob ЖЫШ ЖН р n. EA 
VO ЖЕ r ma ІНЕ? 一 种 方式 是 使 用 dup2 РАҚ. 


Жіпсішіе «unistd,.h-» 


int dup2íint oldfd, int newfc'; 





返回 ; 壳 成 功 则 为 非 负 的 描述 竺 ， 者 出 错 则 为 -1， 


dup? ЕШ А А оша 到 描述 符 表 表 项 newfa, 38i BOR ЖЖ newfd 以 前 的 内 
Ж. WIR newid CEHA Г, dup? Z 45:18 ойна 之 前 关闭 newfd. 

BEWA dp204,b) 之 前 ， 我 们 的 状态 如 图 11.11 Бон, ЕЛІ {标准 输出 ) 对 应 于 交 
РА СЕАТ т), WRR 4 对 应 于 文件 了 《比如 说 一 个 磁盘 文件 )。A 和 B 的 引用 计数 都 等 
于 1。 11.14 ХТИН dupX(4,1)2 a Ff. МАНЫ В. w Fa CAREAT. 
半日 它 的 文件 表 和 v-node Ж ЖЕЛП, = ze ЖГ; 文件 B 的 引用 计数 已 经 增加 了 。 MEAR, AA 
到 标 礁 输出 的 数据 都 被 重 定 由 到 文件 B。 

WE EAMA WR hoinkies。 
3 TERR KEqe S 3 ARM Зе "I^ de "D ОЖ, A EUER S^ RERA 
“Ж hoinky", m "c" ЖЖ: Л) “А hoinky", 


练习 题 11.4 
如 何 用 ар 涯 标准 输入 重 定向 到 描述 料 52 
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T T YR. HER V-node Ë 
(每 个 进程 - Ы) (所 有 进程 共享 (所 有 进程 共享) 
文人 
@0 MEN қ-зз” 文件 访问 | 
1 2 文件 位 置 文件 大 小 | 
付 3 | retento | ;文件 类 型 ， 
fd 4 MENN MEN 
文件 B 








refent =z 
图 11.14 通过 调用 Сор2(41) а 2 УРЕ 
初始 状态 如 图 1111 所 示 。 


练习 题 11.5 
RRRA I foobartxt Н 6 A ASCI 码 字 符 “foobar” 组 成 ， 那 么 下 列 程序 的 输出 是 什么 ? 


1 "include "'csapp.h" 

2 

3 int mainí) 

4 { 

5 int ЕЗІ, ЕЯ2; 

6 char c; 

7 

8 fdl = Opení('foobar.txt", O RDONLY, 0); 
9 tdz = Open("ioobar.txt", O RDONLY, 0); 
10 Кеай14Г02, &c, 11; 

11 Dupzifd2, 81); 

12 Read(fdl, ke, 1); 

13 printf("c = %сап", с): 

14 exitiü; 

i5 ] 
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ANSI C 定义 了 一 组 铅 级 输入 输出 函数 , 称 为 标准 VO Ж. 为 程序 员 提 供 了 Unix VO RRA 
的 接口 。 这 个 库 (libe) 提供 了 打开 和 关闭 文件 的 基数 《fopen 和 felose)、 读 和 写字 节 的 琢 数 fread 
和 fwrite)、 读 和 写字 符 囊 的 阴 数 (fgets 和 fputs)， 以 及 复杂 的 格式 化 VO АЖ (scanf 和 print). 

标准 VO 库 将 一 个 打开 的 诡 件 模型 化 为 一 个 流 。 对 于 程序 员 而 言 ， 一 个 流 就 是 一 个 指 问 类 芹 为 
FILE 结构 的 指针 。 每 个 ANSI C 程序 开始 时 者 有 二 介 打 开 的 流 stdin, stdout 和 stderr， 分 别 对 应 于 
标准 输入 、 标 准 输出 和 标准 错误 ， 
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Hinclude «sLdio.h» 


extern FILE *sLdin: /* standard input (descriptor Ü) */ 
extern FTLE *stdout; /* standard output descriptor і) *#/ 
extern FILE *siderr; /* standard error tdescriptor 2]! *» 


类 型 为 FILE fti, oe Ж ЖЕ АЛЕ ЕЛ. ACER PP DC HEREDI Rio ШЖ ТАЛУУ H: 
gh [ETE IF] Unix ОЛЕН RE RBS RU. Pl, REX FEF, CR REEL 
标准 VO 的 gete p S. 每 次 调用 返 同文 件 的 下 一 个 学 符 , МЖ RAH gete 时 , 库 通过 调用 ІХ read 
图 数 米 填充 流 缓冲 区 ， 然 后 将 缓冲 区 中 的 第 一 个 字 节 返 回答 诺 用 程序 ， 只 本 缓冲 区 踪 有 木 读 的 子 
17, Hpt gete 的 调用 斌 能 自 接 从 流 经 神 区 得 到 服务 。 


119 综合 : 我 该 使 用 哪些 1O 函数 ? 
& 11.15 总 结 了 我 们 在 这 - ЕНІН JA h UO E, 


fopen fdopen 
fread fwrit& 
fscant fprintf 


sacant sprint 
fgetg fpuks 
E£lush isgeek 
fclose 


CG mi HFE 


гіс readn 
rio writen 





rio readinitb 
rio readlineb 


орел read rio readnb 
write  lseek Unix VO Ва 
atat | elose (通过 系统 调用 来 访问 ) 


i bx VO Ө RIO # 





图 11.15 Unixl/O. ЖЖ VO A Rio z [Bl x S 


Unix LO 是 在 操作 系统 内 核 中 实现 的 。 应 用 程序 可 以 通过 open. close. 1ѕеек. read ЖІ write X 
样 的 函数 来 访问 Unix ТО, S2 5 ЖТ Rio 和 标准 WO v S ÉD EET CI FD Unix VO AROR EH 
Rio 函数 是 专 为 本 书 开 发 的 Tead 和 write 的 健壮 包装 (wrapper} AR wiii aah Afii (short 
counts2, ТНА CRAT RUE ЕНТ РУТА. АЯ UO РАЙЫ E Т Unix UO Ай 1 
UO SES ТП Ет. Runde ГО 例 程 。 

WA. АРЕ РЕНЕ AEH ВЕ К ЖЕН ББ? МЕПОЖЖЕМНЫЛЕН 6 UO 2. 
ҚАП C КАТ QU EDS ET ГЕЛ EE ШО, ІП АРАҚ Unix VO Р. NEn HE, 
TW ETE B w Їй. 

小 辛 愧 是 ， 当 我 们 试图 对 网 络 输 入 输出 使 用 标准 НОМ, EART ES A HRT e SR 
像 我 们 将 在 12.4 节 中 看 到 的 那样 ，Unix 尘 网 络 的 抽象 是 -种 称 为 于 接 字 的 文件 类 型 ， 利 任何 Unix 
文件 一 行 ， 盆 接 宁 也 是 用 文件 描述 符 来 引用 的 ， 在 这 种 情 襄 中 被 称 为 记 接 字 描 述 符 。 席 用 进程 道 过 
庶 写 赛 接 字 描 述 符 来 与 运行 在 其 他 计算 机 上 的 进程 通信 。 

标准 UO 流 ， 从 某 种 意义 上 而 二 是 爹 双 工 的 ， 因 为 程序 能 够 在 同一 个 流 上 执行 输入 和 输出 。 然 
f. РАУС Е АНЭУ ЗЬ: 

. IK: ЛАО ИЦ А Б. Rb ВИРА АЖ tush, fseek. fsetpos 或 者 rewind 
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的 调用 ，- ARAARA C Т НАК i. fush 唤 数 请 空 与 流 相 关 的 缓 神 区 ，。 
i ep Sri H] Unix ТО seek AA E CREARI А 8. 
限定 二 :输出 通 数 跟 在 输入 通 数 之 后 ,如 订 中 间 没 有 搬入 对 fush, fseek, fsetpos 或 者 rewind 
的 调用 ，- УЫНАН АЛЕН ТА. 2 т, ЕЗЕЯИА ЖО T TCR 
H, 
НЕМ УН Г Ы АЙ, ТЕО E EIEN кек 时 数 是 正法 的 。 诗 流 WO 的 第 一 
个 限定 能 锅 通 过 采用 在 每 个 输入 操作 前 刷新 炙 冲 区 这 样 的 规则 来 保证 实 斑 ， 然 而， 保证 实现 第 二 个 
ШЕНЕ JGMAR. WE ТИЛЕ ЕШШ E ҤШЛИПИИТИ. 一 个 用 来 读 ， СОҢ: 


FILE *Epin, *Ipout; 


іріп = Edopenisockfo, "r"]; 

fpout = tcopen(sockfd, "w"): 

fH ADU ЛЕША IR S PUE ОК ЛУНЕ (L АА SE ЖН fclose, РЕЛ Bee Н 
АПИЫН SERI ЇЙ AS EUR. OSEE ЕЛІНЕ. 

fclose;ifpin); 

fclose!fpoul); 

КЕЕН SET RAE] UD Ie] В НЕЕ О Е. 所 以 第 二 个 close 操作 就 会 兴 败 。 
ЖИДЕ, БЕЛТ UE, АЛАД. 但 是 在 个 线程 化 的 {threaded) 程序 中 关闭 - 个 已 经 关闭 了 的 
ШАЙ a s pak Kaki CB 1174 77). 

因此 ， 我 们 推荐 你 在 阅 络 套 接 字 上 不 要 使 用 标准 LO 函数 来 进行 输入 和 输出 ， 而 要 使 用 Rio M 
数 。 如 来 你 大 要 格式 化 输出 ， 使 用 sprintf 孙 数 在 存储 器 中 格式 化 :个 字符 串 ， 然 后 用 rio_writen 把 
к ЖЕЛ» ШЕЖЕ ДАДА. ER rio_readjineb 来 读 -- 个 完整 的 文本 行 ， 然 后 用 scanf 
从 文本 行 提取 不 同 的 字段 。 


11.10 Л 


Unix 名 供 了 当 革 的 系统 级 函数 ， 它 们 允许 应 用 程序 打开 、 关 闭 、 读 和 写 文件 ， 更 到 文件 的 元 数 
Wo ARAI IO Exclu. Unix 的 读 和 写 捞 作 会 出 现 不 是 值 (short counts)， 应 用 程序 必须 能 正确 地 
观 太 相处 理 这 种 情况 。 应 出 种 序 不 用 接 凋 用 Unix UO ра, ЛУН Rio f, Rio 包 通 过 反复 执 
行 庶 号 操作 ， 自 全 传 送 完 所 有 的 请 求 数据 ， 自 动 处 理 不 足 值 ， 

Unix 内 核 使 用 三 种 相关 的 数据 结构 来 表 小 打开 的 文件 。 描述 符 表 中 的 表 项 指向 打开 交 件 表 中 的 
A, ТИТ ЖЇР ЖИ МДИ) v-node 表 中 的 表 项 。 每 个 进程 部 有 它 自 已 单独 的 描述 符 表 ， 而 
也 有 六 进程 共 学 问 一 打开 文件 志和 v-node X. 理解 这 些 结构 的 一 般 构成 就 能 使 我 们 清楚 地 理解 文件 
КАН VO Ж |], 

RHE UO ñ: e Unix LO 实现 的 ， 并 提供 了 一 组 强大 的 高 级 UO Е. ЕГ КСЫ НЕЕ 
П, AÈ WO 更 简单 ， 是 优 于 Unix ПО 的 选择 。 然 而 ， 因 为 对 标准 VO 和 网 络 交 件 的 :一些 相 吉 不 
兼容 的 限制 ，Unix IO 比 之 标准 VO 更 该 适用 于 网 络 应 用 程序 。 
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参考 文献 说 明 
Stevens 编写 了 Unix VO 的 标准 参考 交 献 [76]。Kermighan 和 Richie 对 于 标准 UO ЖЕН Y 38 
晰 而 完整 的 讨论 {40]。 


gk Ie E Mi 
1.6 € 
TIERE EL i LIA? 
sinclude "csapp.h' 
int maini) 


| 
int І81, fd2; 


#31 = Openi"foo.txt", O RDONLY, 0}; 
fd2 = Openi"bar.txt", O HDONLY, 0); 
СІоѕе (42); 


иі мл £m іл oan» La М ка 


VE 


10 idà = Әгепі"Баг.іхЕ", О RDONLY, 0); 
11 printfíi"fd2 = d\n", 42); 

12 ехі:ш(0); 

13 } 

117 % 


ЕРІ 11.4 中 所 示 的 cpfile 程序 ,使 得 它 用 Rio РӨ АНЕ АЕ А) ИЕ. CK MAXBUF 
+T. 

118 %% 

ЖЗ 11.10 中 的 statcheck 程 太 的 一 个 版 本 , ТЫ fstatcheck, "E АА fT СН 一 个 描述 符 数 
TOS ДЕ XI. 

119 %Фф 

AR MED IER 11.8 趴 的 对 fstatcheck 程序 的 调用 ， 

unix» fstaccheck 3 « foo.txt 

你 可 能 会 预想 这 个 对 fstatcheck 的 调用 将 提取 和 显示 文件 foo.txt 的 元 数据 。 然 而 ， 当 我 们 在 我 
们 的 系统 上 运行 它 时 , 它 将 失败 , 返回 * 坏 的 文件 描述 符 ”, 根 据 这 种 情 沈 , 填写 shell 在 fork ЛІ execve 
T 2 [8]: 2043 4T ТИАН. 

if iFork(] == 0) í /* child */ 

/* What code is the shell executing right here? %; 


Execvei("tfstatcheck", argy, envp); 
} 


11.10 %% 
ЕЕЕ 114 中 的 epfile JS, ERES Үз ТӘЖ infile. 20RIS Т іпШіе, ЖА 
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贝 ме 到 标准 答 出 ， 否 则 像 以 前 那样 持 贝 标准 输入 到 标准 输出 。 一 个 要 求 是 对 于 两 种 情况 ， 你 的 解 
答 都 必须 使 用 原来 的 拷贝 循环 《第 9 一 11 行 )。 只 允许 你 插入 代码 ， 而 不 允许 更 改 任何 已 存在 的 代码 。 


练习 题 答案 


练习 题 11.1 ЖЖ 
Unix 进程 生命 周期 开始 时 ， 打 开 的 揪 述 符 赋 给 了 stdin 《描述 符 0), stdout (描述 符 1) 和 stderr 
(ЖЫК 20. open 半数 总 是 返 门 最 抵 的 未 打开 的 描述 符 ， 所 以 第 一 次 调用 open 会 返回 描述 符 3. 
调用 close 闭 数 会 释放 描述 符 3。 最 后 对 open 的 调用 会 返回 描述 符 3， 因 此 程序 的 输出 是 “fd2=3”， 


练习 题 11.2 答案 

描述 符 tal 和 faz 每 个 都 有 各 自 的 打开 文件 表 表 项 ， 所 以 管 个 描述 符 对 于 foobartxt 都 有 它 自 己 
Nr Xx EB. 因此 ， 从 fd2 的 读 操 作 会 读 取 foobar.txt 的 第 一 个 平 节 ， ЖЩ 

Ù R t 

而 术 是 像 你 开始 可 能 起 的 


C = Q 


练习 题 11.3 答案 

H- 卜 ， 子 进程 会 继承 父 进程 的 描述 符 表 ， 以 及 所 有 进程 共 昔 的 同一 个 打开 文件 表 。 因 此， 
描述 符 fd 在 父子 进程 中 都 指向 同一 个 打开 文件 才 表 项 。 当 子 进 程 读 取 文 件 的 第 一 个 字 节 时 ,文件 位 
置 加 1。 因 此， 父 进 程 会 读 取 第 二 个 宁 节 ， 而 输出 就 是 


с = б 


练习 题 11.4 答案 

重 定 问 标 惟 输 入 (描述 符 0) 到 描述 符 5， 我 们 将 调用 dup2(5,0) 或 者 等 价 的 
dup2(5,STDIN FILENO). 

练习 晴 11.5 ЖЖ 

第 一 眼 焦 会 想 输 出 应 该 是 

cC = Ё 

但 是 内 为 我 们 将 fdl ЖЕТ fd2， 输 出 实际 上 是 


C = б 
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仙 络 应 用 随处 可 见 。 任 何 时 候 你 浏览 Web、 发 送 email AERE- P X window, fpi ti 
使 用 -- 个 网 络 应 几 各 序 ， 有 趣 的 是 ， 所 有 的 网 络 应 用 都 是 基于 相同 的 基本 编程 模型 ， 石 者 相 忆 的 整 
ЖАРЫ, ЖЕНЕ КЕНЕП. 

Б Hc ТН E {ЖИП АБИЛ с ШИЖ. Ba. Ян. 5. FRP, 
ТЕМЕ (memory) IPL ЖДД АҒЫН, Е ЕЛ. BS ROS T uci. WEA 
н. ВОЕНЕН Pom НАНЫ, DL UD n 13 FI МЕМ ЕЕЕ 2: 
的 客户 端 -服务 器 程序 。 最后， 我 们 将 把 所 有 这 些 概念 铺 合 起 来 ， 开 发 一 个 小 但 是 功能 齐 伞 的 Web 
服务 器 ， 能 够 为 真实 的 Web SU eS SEDES NI IEEE Y. ТЈЕР А. 
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每 个 风 络 应 用 都 是 基 十 客户 端 -服务 器 模型 的 。 想 据 这 个 模型 ， 一 个 应 用 是 由 TRA SX. 
和 个 或 者 多 个 客户 端 进程 组 成 。 服 务 器 管理 某 种 资源 ， 并 疆 通 过 操作 这 种 资源 来 为 它 的 客户 问 提 
供 某 和 服务 。 酌 如 ， 一 个 We 服务 器 管理 了 一 组 磁盘 文件 ， 它 会 代表 客户 端 进 行 检 索 和 委 行 。 个 
FTP 服务 器 就 管理 了 一 组 磁 操 文件 ， 它 会 为 客户 端 进行 存 竺 和 检索 。 相 似 弛 ， 个 电子 邮件 服务 器 
ЕНІ Eyi БАРИНЕ. 

客户 端 -服务 器 模型 中 的 基本 操作 是 事务 (transaction) 《图 121). 2E P385 - B 2 65 A H 
四 步 组 成 ， 

I. M : 个 客户 端 需要 服务 乓 ， 它 向 服 务 器 发 送 一 个 请 求 ， 发 起 AEZ. Pa, i Web 浏览 
HER- улан, ал (Wk Web 服务 器 。 

2. 堪 务 器 收 到 请 求 后 ， 解 释 色 ， 并 以 适当 的 方式 操作 它 的 资源 、 例 如 ， 当 Web 服务 器 收 到 浏 
WIRE. VE -个 磁盘 义 件 。 

3. 服务 器 给 客户 端 发 送 一 个 响应 ,并 等 待 上 一 个 请 求 . РИШ, Web ЛЕН a tF la t АР. 

4. APARANA АК, Bib, 75 Web sU as АЛЕ 86 Л, UKA BRL. 


L PIE IK 
ТИНЕ 


121 ЕР 
АІ Ра HC A ДЕЧИ. 而 不 是 在 本 上 下 文中 常 被 称 为 的 机 器 或 者 主机, Е OPEL), 
一 台 主 机 可 以 同时 和 运行 许多 不 同 的 客户 端 和 服务 器 ， 而 几 客 户 端 和 慑 务 器 的 事务 本 以 年 同 一 癌 或 是 
^] ESL. АС) ЖЕЛІН 48 дЕ ЕВНЕЙ ЕЛЕР, Ж-Е ДӘНІ). 
ЕН; ЖАҢ-НИЖЕЯБКЕЕЕЗ 


ХРЖ-К5БЖЕЛЛАҚКЕҚЖЯ. 而且 也 没有 数据 库 事 务 的 特性 ,例如 原子 性 。 在 我 们 的 上 
下 文中 ， 事 务 仅 仅 是 客户 端 和 服务 器 之 问 执行 的 一 系列 步 艰 ， 
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12.2 网 络 


客户 冉 和 服务 器 通常 运行 在 不 同 的 主机 上 ， 间 且 通 过 计 攻 机 风 赂 的 硬件 和 软件 资源 来 通信 。 网 
培 是 复杂 的 系统 ， 在 这 时 我们 只 想 了 解 一 点 皮毛 。 我 们 的 目标 是 从 程序 品 的 角度 挫 你 一 个 可 工作 的 
B5 HM. 

村 于 一 个 主机 而 言 ， 了 网络 内 是 又 一 种 TD 设备 ， 作 为 数据 淹 和 数据 接收 方 ， 甸 图 122 BER. 一 
ЧЕН UO 总 线 扩 展 梢 的 适配器 提供 了 到 网 络 的 物理 捷 口 ,从 网 络 上 接收 到 的 数据 从 适配器 痉 过 VO 
НГЫ МОЕ NEITAR ААК DMA (BOE APO K) HE. ніш, Bg 
EM Wasiy DL ЖМ. 







Еннің мава 


sss 
"| wit 


"WB | (сеге 
кыз | таки 


НЕ та ТІМ” 





ШІ22 = ТЕ АТИНЕ 

Wm p. Е А НЕ Р НА I Е. MEETS ШТАН (Local Area Network. 
қам)» ОАЕ ОНЕ SES gab, ЖИПТИ ЖЕ ЖЮ (hemet, E 
ВИ А T НЕСЕ CXerox PARCO dE 20 182 70 ТЕ Е ЕШ. ССА ВЕ E UE RE 
在 3Mb/s-- Ghi ТЕН), 

КА K HB CEthernet segment) 15 — pitt (通常 是 双 绞 线 ) ж — k hita k T. 
如 图 12.3 Fro. HUKARERE T opp. ИШЕН — 16 e] EE. ты 
du erre e duode. АМИН I00Mbis 或 者 1Gha。 一 端 连 接 到 主机 的 是 配器 ， 而 另 一 站 
WIES ЕЕЕ SN TARDE. RERBE ООН НДЕ UL P984 0. ERU CREER FRE 
iD. Bue. 86 ЕЕ АВЕ, 

ЕШ ЖИК ЕН TERE H 48 (ТИШЕ. E EET THERE ИК A PETERE E. 一 
RENICE Rin ЖАМ (rame) ВАЧ КЕНЕ ЕЙ. 1ТЕН —Ж umet 
ІНЕ (header) jr. Hicks iuc Mum RI EL КАҢ CLR RETE] ЕШЖ. ЖЕ ИЕ ЕШ Ro ИЖ Е 
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É (payload. 9 ЕЙ ЕНІНЕН SX TE, (LEER TEHEBI L BUE ДАТ. 





图 12.3 以 太 网 分 段 


使 用 一 些 电线 和 由 做 网 恬 Lbridge) К/А 7, EA KE ERI DUE АЛЬ, ЖА 
桥接 以 太 网 《bridged Ethernet), ІМ 124 所 于 。 括 接 以 太 网 能 够 跨越 整个 建筑 物 成 着 校区 。 条 个 
НАДАН, - 些 电 总 连接 网 桥 与 网 桥 ， 而 另外 一 些 连 按 网 桥 和 集 线 朋 。 这 些 电线 的 带宽 本 以 是 
不 辐 的 。 和 村 我 们 的 示例 由 ， 了 网 酉 与 网 桥 之 间 的 由 赣 有 TGb/s MarR rf PORA BE ETE Ze dz IR] ELE 
{Г АПАЕ 100Mb/s. 
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网 俩 比 集 线 事 更 驳 分 地 利用 了 电 织 带宽 。 利 用 一 种 陪 遇 的 分 配 算 法 ， 它 们 限 兴 对 间 莫 动 掌 习 哩 个 
主机 可 LUBRICA. ЖАЛАМЕН, ШЕН НЫМ PLE DERE L1. ААЦ, d 
ЖАДА ЯЛЕ qmi PIER LA TSLB. iix SA FEE X НАУИ, edu. [rir v 
内 了 其 他 网 段 上 的 带宽 。 ЖАШ, 如果 主机 A KU Zb Е-Е РЫМ LJ EBLC, ШААН ХИ 
ЕМЕН ТАН Y АНЕ РО С. МЕТУ НЦ ДА УЕ С 的 网 段 连 接 的 端口 。 

为 了 答 化 局 战 网 的 志 示 ,我 们 净 把 集线器 和 网 桥 世 及 连接 记 们 的 电费 罚 成 - - 根 水 平 线 ,如 图 12.5 
Bs 

在 后 次 的 而 本 级 别 中 ， 和 多 个 不 非 容 购 局 域 网 可 以 遂 过 岂 做 路 由 器 (router) 的 特殊 计算 机 连接 起 
X. "LEM A internet. ОНДЫ), 


] ШИМИ ДӘН С bridge Cs. EI SIE ЕПС. host Cs. Ж 
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图 12.5 局 域 网 的 概 李 视图 


Am к) a 小 写 $46 internet и-и. 耐用 k5 raw Internet Adi 
ЕН, ddp PETS EE ВФЕ, 


ВЕНН aW al F аана — ERI UAD). Pi BERE E FE B h И h a 
РЕК. iR dE WAN (Wide-Area Network, Г) Hine. ҒЫ АЕН ETT ДІНІҢ 
ИННИКИ Ө К. Miti. ЖШ ЛГАН SE di deb o bi H HI” EIER E interner С ЕХ У, 
Иш. E 126 展示 了 一 个 intemet RA 3 Б НЖИ ЕТ - Ны ht, 











ЧАМ à АЫ | 


124 一 个 小 型 的 Iniemet (HEDH) 
M TRE KH T-” (ТЕЕ ТУ Е ТУГА 


meme LRH ЕХЕЕНЕНЕ, lei I scd ELEC A E BOR AA REED 
шенін. B£ EHLELH КЕЕ ЕЛЕНЕ, ІНЕШЕЕН AK Ж d ЖИН pi de 
ТЕА E Е — Er B ir z dne y ap ERE? 

WO MER T he tre f REER ЕРНІНЕ, ЖЕТ REI ink. Dr 
HIER Mieux. Nu EH NER BR I (nh ТЕРЕН. 这 种 协 资 必需 提供 两 种 基本 
E 2): 

€ тізі, ЖЫН KH RE ЖЕНЕ ЖЗ ЕЙІН. internet i ti Mc ed 
8) ВН Е P-A ENAA ЖЕТЕН. ВРЕ Е ОЗЕ 
个 这 种 internet 34t (internet address), ӘНІНЕ нр ГЕ. 

. FERH. (РНН КРИ АТАРА REM HOD I. ЖН КЖ ЖИ Ж 
ЖҮНДҮ. imema (互联 网 络 } ДЕНЕ Ж ЕЕЕ ЛЛА ЖИЕ ШШШ (chunk) 
一 一 也 就 是 包 一 一 的 统一 方式 ， 从 而 消除 了 这 些 整 异 。 一 沾 包 是 由 包头 《header) Hii 
8 (payload? 组 咸 的 ， 其 中 包头 插 包 的 太 小 以 及 短 主 机 和 日 的 主机 的 地 直 ， Tix A B 
Н.Ж d BLA HH EHE ГА 

12.7 Bc T — T ЕВОРА ЕЧЕН [EF] internet. CLEARS) Бр АЕ ЖЕ ЖЕ aii 
数据 的 示例 。 这 个 ineme (НЕМ) ІНІН T ROSE IG Е — В н Ж ЕЕЕ. “КЕРІ 
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行 在 主机 АБ, И АБАМ ЯШ, БЯХ Е ТТЕ В ЕРІ Н, E 
机 B 则 连接 在 LAN2 |。 这 个 过 程 有 8 个 基本 步骤 : | 

1. ЗА1Г{Е+ А LAA HTT АНЯ, ME E hl: E F8] ЛДЫ НАР 
"px. 

2. TAL A КЕРН ВИНО НЕН НІЛ ineme (互联 网 络 ) 包头 和 LAN1 W, SU T — 
^" LANI М. internet (Н RERO 包头 寻 址 到 intemet (TERA 主机 В. LANI (BUE s EE SURE 
Нн. AES Р ЕМИЕ. ZEA. LANI 帧 的 有 效 载 苘 是 -个 internet (互联 网 络 ) 包 ， 其 有 
A BUR ЖЕЕ Л ЖЖ. DOR Ж a А КЕН IA ES. 

3, LANI ААГ Lie | RA L 

4. "WEE SUXA ES EBEN]. ЕНІН LANI 适配器 从 电 编 上 读 取 它 ， 并 把 它 传送 到 协议 软件 。 

5. 路 由 器 从 internet 包头 中 提取 出 目的 internet 地 吉 ， 并 诈 它 作为 路 由 表 的 索引 , 确定 加 哪里 转 
ARTE, EAA ELAN? BHRR HRI LAN1 ИЕ. ШЕШЕГЕ В 的 新 的 LAN2 帧 
头 ， 并 把 得 到 牛顿 忧 着 到 适配器 。 

6. BHAR LAN2 ЕНЕ ЛАЖ АІ. 

7. 当 此 帧 到 这 主 机 孔 时 ， 它 的 适配器 从 电 纺 上 读 到 此 帧 ， 并 将 它 传 送 到 协议 软件 。 

8. 最 后 , 鞋 机 了 工 的 协议 软件 剥落 包头 和 帆 头 。 当 服 务 器 进行 一 个 读 取 这 些 数 撕 的 系统 调 几时 ， 
中 以 软件 最 终 将 得 到 的 数据 拷贝 到 服务 器 的 虚拟 地 址 空间 。 


TELA ENB 
* P f | p" 
СОСЕ | |... ez 
ЕТЕ 协议 软件 каке) 
ЖЕ u 2 (ГЕН PE 
—T— * 





LAN? 
, iG 7 
: Router 
mia ака d Шар acus ВЕ ТРАТ 
LANI Lan 2 ECT 





LANZ 
CEXIPHIRE (S) 





p | 
Vu ü 


图 12.7 在 internef (互联 网 络 ) 上 ， 数 据 是 如 何 从 一 台 主 机 传送 到 另 一 台 主 机 的 
AB: PH: imtemet (НЫН) 3, ЕНІ. LANI 9А U. FH2: АМ? ЁТ TO 


TUA. (GR EGENTES ТИЛИ. BUCROI [ELE ТАТ K R АЯЙ, АБАЛ} 


VE? ЕЕН ARDER Н! ЕЗШЕ? ЧЕКЕ. ШЕШИНЕ? 如 果 UPRREEIKTX 
zum? 虽然 如 此 ， 我 们 的 示例 抓 住 了 internet〈 互 联网 络 ) 思想 的 精髓 ， 封 装 是 关键 。 
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12.8 全 球 IP 因特网 


I THE IP 因特网 是 internet (互联 网 阁 ) 最 著名 和 最 成 功 的 实现 。 从 1969 FE, ТШЕК 
Шеш (ЕТ. НЕМЕМІНИНЯ БИШИ ЛЕТИ H ЖЕТЕК. qH ПИ, ЭН яп 年 代 早 期 以 
X. P3 - Bo a ROSE A- A Rp s nds. 12.3 Won T — HE PR НІ 
IPB COR FEES PER in, 











Жата кнши + н 
к € ш. amr | 
| томғ | нні | 





Ẹ 
| Mamm | иң 
| | | 


нинин иш = Е 
|Ш uum шшс ш-н EM 





І28 — Р S Rim Н НК ІН 
| ЧЕ ИЕН СЕН гіт ТСРЛР (Transmission Control Protocol/Interaet Protocol, РЕ 
SIL ВЕ ERR UD ОРЕ, TASA IC NR ЕНЕР ҒЫП. ЧЕНІНЕУЖНІН 
3r e E E HET o ЖЕН Unis VO 函数 来 进 行 通信 【我 们 将 在 124 т ИНЕП), 
ЗЕ PARI ЖЕ Ж ЖИИ ЖЕЙ. Kah А Ы, H ЙН ИН F BY Ж 
TCP/IP @ Ж. 

ТСРЛР 3EEc E — HRK. Щр ЕНІМДІ, 向 如， IP RUE Ж E h ik 
ШЕШ, BARRAREN- ANRA ЕНІНЕН TR Siya, 120 W 8 3830 (datagram). 
PRENER Em E Rar h), Dp, TERERAA РЕ КЕШЕ ИИ, ТОЖЕ И. 
UDP (FR REI) ЖИНГЕ ТР МД. ЖН-Ж, {ШЕЖЕ NOR A d LS 
ТСР 是 一 个 建筑 在 ЇР 之 上 的 复杂 协议 , NOCT HEFTE OT AERE XU. {双向 的 )》 连接。 为 了 简化 我 们 
的 讨论 ， 我 们 将 TCP 笋 做 是 一 个 单独 的 整体 协议 ， 我 们 将 不 讨论 它 的 内 部 工作 ， 只 讨论 TCP 和 
IP 为 讼 用 程 友 提 供 的 某 些 基本 功能 。 我 们 将 不 讨论 UDP. 

内 程序 员 的 角度 ， 我 们 可 以 把 因特网 看 做 一 个 世界 范围 的 主机 上 全 二 ， 油 是 F 特性 : 

е EB HERUM A —H 32 I IP LE, 

е АНІРИНКЕНАД-НЕЗНЕЯЯЯЕ CIntemet domain name?) 的 标识 ， 

1 XE ЕН E fri Fei utr] — 1-6 66 (connection) HE fn] ДНЕ D e EAL D Ang dp? 

IE 

РЕНИН А Kn e ede. 
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12.31 IP 地 址 
ІР АШ 1320524. МЗ) ГД IP 地 址 存放 在 如 图 12.9 Pp qs IP 3e sib 8 
Жер, 





—.——_—_.__.  - 


netinet/in.h 
/* Internet address structure *, 
sLruct in асі + 

unsig^2ed int s addr; .* network byte order ibiq endian) */ 


1; 





“— getinerin.h 


图 129 ІР ШЕ 


ж. ARABES? 
把 一 个 标量 地 址 在 放 在 结构 中 , Ж ЖЕЕ Н п ТИКЛЕ. 为 耳 地 址 定 头 一 个 标量 类 
型 该 划 有 意义 ， 但 是 现在 加 改 已 经 太 迟 了 ， 因 为 已 经 有 文 量 应 用 是 基于 此 ,的 ， 


图 为 因特网 主机 本 以 在 不同 的 主机 字 ІНЕ, ТСРЛР Afrm Sf SETE 至 的 网 络 字 节 
МЕ (network byte order} Сян АРЕ 2, ІР 地 址 ， 它 放 丰 包头 中 ， 通 过 网 络 。 有 有 IP ehti 
Bm RE REEL CASE MRE ARR, BUE UE TIRT Chost byte order? 是 小 
mik. Unix HEET КЕКЕ ЕДА ЕИ ЛП DNE FP TEE SCTRUAE 6, 


"Include «netinelt/in.hs 


unsigned long int htonlíunsigaed long int hostlong!; 
unsigned short ict üncons(unstaned short int hosishort!; 


返回 : ЖЕМЕ o REF ИН. 
unsigred long int nrohliansigned long int netlong!; 
| unsigred shori inr arohsi:unsigeed short int netshort!; 


dug. dB idm. 

hotnl РЕ 32 б RATAL EISE А ds m TEES то & 32 УЖЕ REFER E 
THE RHET BUE T. htons 和 ntohs HRO 16 (B AE E O y BA pit a. 

[P HU i Pl Tb M PR ЕТ. XUL ЕТТЕН T eG K. JHS А Н 
т Тар Е. POR, 128.2.194.242 sX m Hil: Ox 8002c21£2 ІМ E Жл. A: Linux 系统 1， 你 能 
ИП HOSTNAME ЖБИ А BLR A Fb a; 

]:nux» hostname -i 

con, 2. 194.247 

IEE FT inet, aton 和 inet, ntoa Ж ЖУ IP КЕНГ ЖЫ ^1 d dtd 2 НИЕ. 


#lnc ude <arpa/inet.h> 





int іле) або (созе char “ср, struct imn addr *inp; 


& ©; 阁 成 功 则 为 |， 车 出 错 则 为 0， 


char *1net ntoalstruct in addi i^t: 





总 回 : 指向 点 分 十 进 制 串 的 指针 ， 
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| inet aton ER ОН АҒЫНЫН (ср) BR 8 — ФЕЙ ШЕН IP НИ (np), ЖМ, 
inet па m ERE 58 ТҮШЕ IP ARRA ER А 2 EHA., ЕЙ. 34 inet aton 
WHER ERRER. ТЇЗ] inet, ntoa 的 调用 传递 的 Mtk tr, 
5. пов 和 aton R4F 4 E 7 

"n" AF PUER (network). "a" AUR EUR (application), 8 "io^. ЖЮ. 


5 HR 12.1 
ЖЕЖ: 


ЕТІ ЕЕЕ TETTE 


Dx 
[l 


DMREEFETEEÍE 





" T 
= rr 


Пи ГИ {ЇЇ 





| £05.188.160,12]1 
bü 12.1409.11 
| 205.188.146.2) 


ЫШ 122 | | 
Н/Е һех2ййс. EHEH TA$ 进 制 参 数 转换 为 点 分 十 进 制 电 井 打印 出 结果 。 枉 如 


unix» ./hex2dd Ox800272e2F? 
128.2 .194.242 


Ж 123 

ЯРИ РЕ даед z, TEEI hi "T usse ЕНЕЛРЗХНИЕНІЛЫ НЫҢ. ш 
unix ,./ddzhex 128.2.194, 242 | 
(x8002e2E2 


1232 因特网 域名 

四 特 同 客户 调和 服务 器 互相 通信 时 使 用 的 是 [Р ИШЕ. Ж. ҒАНЫН. Ж dE icit 
的 ， 所 以 因特网 也 定 交 了 一 组 更 加 人 性 化 的 成 者 (domain name). LR FERT DA 4 B: PU IP 地 址 的 

xittyhawk.cmcl.cs.cmu.edu 
МАКАТ ТЕКНИК, W MST tribu Hep HITS SH J ЖЕННИ 
HM AA. ІН 12.10 кл Г IIR HM is. КЕШЕНЕҢ ТТИ 树 的 节点 表示 域名 ， 
КИНИН: Б, Гай. FERAT (subdomain), Ek Sj arp — E e — 1 x dr ЁШ 
Із. | ЖЖ — HI 8 — E A ( firsi-level domain names ), 由 非 赢 利 绷 织 ICANN Internet Corporation 
for Assigned Names and Numbers， 因 特 网 分 配 必 字数 字 协 会 】 定义 。 常见 的 第 П LIE com. 
edu. gov. огр ЖІ net. | 

PRERE Gecond-level) ШИ, Win cmuedua, ЖЕНУ ЖҮН ICANN ШЕ КЕ 
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按照 先 到 先 服 务 的 基础 分 配 的 。 -日 一 个 组 织 得 到 了 一 个 第 二 层 域名 ， 那 么 它 就 可 以 在 这 个 子 域 中 
创建 任何 新 的 域名 了 。 





zr A p) e 

mil adu qov com 3 — RS 
Í. N Bop 

mut сти berkeley amazon 
ZN 第 二 司 域名 

CS есе www 

ХА 208.216.181.18 
сто! pal 





kittyhawk глрепа! 
128.2.194.242 1262 189.40 


81210 因特网 域名 层次 结构 的 一 部 分 
因特网 定义 了 域名 集合 和 下 地 址 集合 之 间 的 映射 。 直 到 1988 年 ， 这 个 映射 都 是 通过 一 个 叫做 
HOSTS.TXT 的 文本 文件 来 手工 维护 的 。 从 于 以 后 ， 这 个 映射 是 和 通过 分 布 世界 范围 内 的 数据 库 一 BR 
为 DNS (域名 系统 ) 一 一 来 维护 的 。 从 概念 二 而 言 ，PNS 数据 库 由 上 百 万 的 图 12.11 ВЕ 
*& 35 Chost entry structure) 组 成 的 ， 其 中 每 条 定义 了 一 组 域名 〈 -个 官方 名 字 和 一 组 别名 } 和 IP 
地 址 之 回 的 鼎 射 。 从 数学 意义 上 讲 ， 你 可 以 认为 ， 每 条 主机 条 日 就 是 -个 域名 和 下 地址 的 等 价 类 ， 
netdb.h 





/* DNS host entry structure */ 
struct hostent 1 


char *h name; /* official domain name of host */ 

char **h aliazses; ^* null-terminated array of domain nimes */ 
int h addrtvpe; /* host address type (AF INET) */ 

int h length; /* length of an address, in bytes */ 


char **h acdr list;  /* null-terminated array of in_addr structs */ 





netab.h 


图 12.11 ОСЕМА 


内 特 网 应 用 程序 通过 调用 gethostbyname RI gethostbyaddr р, M DNS Sri TH ЕНІ 
ЖП. 








#includje <пегар.ћ> 






struct hostent *gethostbyname(const char %паше): 
返回 : 着 成 功 则 为 非 NULL, ZEIA NULL 指针 ， 同 时 设置 emo. 


struct hostent *gethostbyaddrí(const char *addr, int len, 0): 


Жо): PADRA NULL, ЖЮ Ж NULL 指针 ， 同 时 设置 hermo. 
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gethostbyname 图 数 返 回 和 域名 name 相关 的 主机 条 日 。gethostbyaddr 函数 返回 和 ІР 地 址 addr 
相关 的 主机 条 日 .第 二 个 参数 给 出 了 一 个 正 地 址 的 字 节 长 度 , 对 于 时 前 的 网 特 阿 而 言 总 是 四 个 字 节 。 
对 于 我 们 的 要 求 来 说 ， 第 二 个 参数 总 是 零 ， 

我 们 可 以 借助 于 图 12.12 中 的 HOSTINFO 程序 ， 来 挖掘 一 些 DNS НІМЕН, ЖАУБАЙ 
令 行 读 肥 一 个 域名 或 太 分 | 进 制 地 址 ， 并 显示 相应 的 主机 条 日。 





code/netp/hostinfo. с 


4include "csapp.h" 


int mainí(irt argc, char **argv) 


d 


char **pp; 
struct in_addr айат; 
struct hostent *hostp; 


if {атас != 2) 1 


fprintfistderr, "usace: $s «domain name or dotted-d3ecimal>xn", 
arqvit]?: 
exit(U); 


if (inet atoníargv[l1], &addr) !- 0) 


позір = беїћоѕіруадаг ( (сопзі char *) &addr, sizeof(addr), AF iNET): 


e gae 


hostp = Gethostbyname(argv[.]): 


printfí'official hostname: $s'Xn", hostp-»h name); 


tor (рр = hostp-»h aliases; *pp !- NULL; рр++) 
printfíi"alias: $sVin", *pp); 


for (pp = Lkostp-»h адаг list; *pp !- NULL; pp++) f 
addr.s addr = *(iunsigned int *) *рр); 
printfi"'address: $sin", inet ntoaíaddr)]); 


} 


exit(0); 


code/netp/hostinfo.c 


图 1212 检索 并 打印 DNS XXL 


每 合 因特网 主机 部 有 本 地 定义 的 域名 localhost， 这 个 域名 总 是 映射 为 本 地 回 送 地 址 【loopback 
address) 127.0.0.1: 


unix» 


./hostinfo localhost 


official hostname: localhost 
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alias: localhost.localdomain 
address: 127,0,0.1 


localhost 2156275! 9227710] SELE (КЕЛІНІҢ НЫ [ — E J Hl n] НА, 
这 对 调试 相当 有 用 。 我 们 可 以 使用 HOSTNAME 来 确定 我 们 本 地 主机 的 实际 域名 ， 

unix- ,/Hhostname 

kittyhawk.cmcl.cs,cmu,edu 


(p RB. -ARAA МІР НАНЕ BR - BEN: 


unix» ./hostzinfo Kittyhawk.comci.cs.cmu.edu 
official hostname: kittyhawk.cmci.cg.cmu.edu 
address: 128.2.194,242 


ЖҮ, URGES. £ Жа] Ду [5] — МІРІНЕ; 


unix» ./hostinfo 7s.mlit.edu 
official hostname; EECS,.MiIT.EDU 
alias: zsS.nit.edu 

address: 18.62,1.5 


тн 上， 多 个 域名 可 以 映射 到 多 个 ТРАВА; 


unix- ./hostinfo www.aol.com 

official hostname: aol.com 

alias; www.aol.com 

address: 205.188.:60,.121 

address: Һ4.12,149.13 

address: 205.188,146.23 

RE ВИЕ ЖЕФ ТД ЕТТЕН ЗИЯ IP Hui: 

ыпіх> ,/hostinto zdu 

GeLLastbyname error: Мо address associated with name 
unix» ./hostinfo cmcl.cs.cmij.edu 


Gethosthyname error: No address associated with name 


劳 注 ， 有 多 少 因 特 网 主机 ? 

.因特网 软件 协会 (Internet Software Consortium. wwwiscorg) 自从 1987 年 以 后 ， 每 年 进行 两 
次 因特网 域 名 调查 , 这 个 调查 , 通过 计算 已 经 分 配给 一 个 霹 名 的 IP 地址 的 数量 来 居 算 因特网 主机 的 
数量 ， 展 示 了 一 种 邻 信 吃惊 的 趋势 ， 自 从 1987 年 以 来 ， 当 时 一 共 大 约 有 20 0005835 EA, # 
年 主机 数量 都 大 概 会 翻 一 项 。 到 2001 年 6 月， 全 球 已 经 有 超过 120 000 000 台 因 特 网 主机 了 ， 


5 3) 12.4 

ЖЕ 12.12 中 的 HOSTINFO 程序 ， 然 后 在 你 的 系统 上 连续 运行 hostinfo,aol.com 三 次 ， 
A. 在 三 沾 主机 末 目 的 钙 地 址 顺序 中 ， 你 注意 到 了 什么 

В. 这 种 顺序 有 何必 用? 
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1233 因特网 连接 

因特网 客户 端 和 服务 器 通过 在 连接 〈eonnection) 上 发 送 和 接收 字 节 流 来 通 人 入。 从 连接 一 对 进程 
EE X ЕЕ, EREA E (pointio-poinO 的 。 从 数据 可 以 同时 双向 流动 的 角度 来 说 ， 它 是 全 
双 工 《full-duplex) 的 。 并 且 从 一 一 除了 一 些 如 粗心 的 耕 钢 机 操作 员 切 断 了 电 绕 引起 灾难 性 的 失败 以 
外 一 一 由 源 进 释 点 出 的 字 节 流 最 终 被 日 的 进程 以 它 发 出 的 顺序 收 到 它 的 间 度 来 说 ， 它 也 是 可 菲 的 。 

JR (socket) 是 连接 的 端点 《end-point)。 每 个 套 接 字 部 有 相 庶 的 蛮 接 竹 地 址 ， 是 由 一 个 因 
特 网 地 址 和 -个 隔 伺 的 整数 端 只 组 成 的 , 用 “地 址 :端口 ”来 表示 。 当 客户 端 发 起 一 个 连接 请 求 叶 ， 
ЕРЖЕТКЕН ҒАНА, ЖАНЫН ҚЫ {ephemeral port), Am. Hos si 
TCHEF Rh EP f СА Ee Мәжа, EARANN I. БІ, Web BE 34518 ЕЕ іт H 80, 
To АИД oras НІНІ 25. ТЕ Unix И T, 3CPER4cBservices 包含 一 张 这 人 台 机 器 担 殿 的 服务 以 
及 它们 的 知名 端口 导 的 综合 列表 。 

一 个 连接 是 由 它 两 端的 实 接 字 地 址 惟一 确定 的 。 这 对 套 接 字 地 址 叫做 穴 接 字 对 (socket pair), 
由 下 列 三 元 组 来 者 示 的 ; 

(cliaddr:clipart, servaddr:servport) 


其 中 cliaddr A58 ТІР Hb. cliport 7 з ВОЗ ГІ. servaddr ДЕЛЕ ДЕП IP НЕДЕ, ПІ servport 
是 服务 器 的 端口 。 例 如 , 图 12.13 展示 了 一 个 Web 客户 端 和 一 个 Web ІЗЕТ МЕЗ. ERAR 
Wim, Web 客户 端的 套 接 字 地 址 是 


128,2,194,242:51213 


Ж) ЖЕЛЕТ [КЖ ae Yk 2 Ya Hb 
128 2.194.242:51213 208.216.181.15.80 








ғы ШЫНЫ p “=== --- asna" ---а-- 
n 1 


: ЖЕНЕ 

Pom. 1: 8282194 242:51213, 208.216.181.15:80) 1 — 
Tm + ДП. ІР 服务 器 主机 地 址 
128.2.194.242 208.216.181 15 


图 1213 因特网 连接 的 分 析 


其 中 山口 号 51213 是 内 核 分 配 的 临时 端口 号 。Web 服务 器 揭 套 接 字 地 址 是 ; 

203.216.181,15:%80 

Еа 80 是 和 Web 2 422 ПП ®. SERER RARS REETZ Ж 
Р 352 (ELE BER H IERTE AET: 

(128,2.194,242;51213, 2208,216.181.15:8)) 
Xt. НЕНІ 

КЕНЖЕ. Fie rd XS LO ЖА TAZ. АЕ ЖЕ. ЕАЯЛНАЙЯ 
两 点 尤其 重要 : 美国 政府 30 年 持续 不 变 的 找 资 ， 以 及 充满 激情 的 研究 人 员 对 麻 省 理工 大 学 的 Dave 
Сәбе 提出 的 “粗略 一 至 和 能 用 的 代码 ”的 投 入。 | 

因特网 的 种 子 是 在 1957 ЖЕ. Ам, ОРН E. ЖЖЖ М Sputnik, Я-ЖАЯЯ, 
REE, ERTEM. Айй, ХАЛТАР (ARPA) АЕ ИЛ УА 


1 
ч 
F 
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在 科学 与 技术 上 的 请 导 地 位 ，1967 %, ARPA 的 Lawrence Roberts 提出 了 一 个 计划 ， 建 立 一 个 叫做 
ARPANET 的 新 网 络 ， 弟 一 个 ARPANET 节点 是 在 1969 年 建立 并 运行 的 ， 到 1971 年 ， 有 了 13 个 
ARPANET 节点 ， 而 且 етай 作为 第 一 个 重要 的 网 络 应 用 涌现 出 来 ， 

1972 年 ，Robert Kahn 概括 了 网 络 互联 的 一 般 原则 : тінін ЯН "XE EC 
的 村 合子 按照 “ 尽 为 传送 基础 ”在 互相 独立 处 理 的 网 络 癌 实 现 通 悦 ，1974 年 ，Kahn 和 Vinton Cerf 
发表 了 TCPAP 协议 的 第 一 本 详细 资料 ， 到 1982 年 它 成 为 了 ARPANET 的 标准 网 络 互联 协议 。1983 
ФА 18, ARPANET 的 每 个 节点 都 切 接 到 ТСРЛР. 5d de RIP ЖИДЕ. 

1985 年 , Paul Mockapetris A 7 DNS, 有 1000 多 台 因 特 网 主机 , 次 年 ,国家 科学 基金 会 NSF ) 
用 56Kb/s ЗЕКЕТ 13 49 BET МЕМЕТ 的 骨干 网 。 其 后 在 1988 年 升级 到 15Mb/s TI 
Вой RR, 1901 年 为 45Mb/s T3 HEIRE, Ж 1988 年 ， 有 超过 501000 & ÈA, 1989ж, Ж% 
的 ARPANET iE AGES T. 1995 $, 已 经 有 几乎 1000000 台 因特网 主权 了 ,NSE 取消 了 NSFNET, 
并 县 用 基于 申 一 打 志 尘 的 公众 网 络 接 入 志 连 接 的 和 有 商业 表 干 网 的 现代 因特网 架构 取代 了 它 ， 
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ЖЖ (соске! interface) 是 一 组 用 来 结合 Unix LO eral ie RURA РАП. X £ АТ 
系统 上 都 实现 它 ， 包 所 所 有 的 Unix €., Windows 和 Macintosh 系统 。 12.14 给 出 了 一 个 典型 的 
客户 咒 - 服 务 器 事务 的 上 下 文中 的 套 接 字 接 口 。 当 我 们 讨论 各 个 函数 时 ， 你 叮 以 使 用 这 张 图 来 作为 
I] S 8. 

ЖАҚ Dp 
apen listenfü 


oper clienttd 


; emen a 
conneck Te Uc accep 







等 符 来 白 下 UP 
E P WNE IAK 


ЕОҒ 
een ooo] гіп readlinsb 


12.14 ERFARE 


Sui: ЖЕЗЛЕПтФЕЙ 
Kiku A PIA ИВА А 20e 80 ҚАЛАНЫ, ЖААЛ ЖЫ, CE 
АМАЛ. 伯克利 的 研究 者 使 得 赛 接 宇 接口 适用 于 任何 底层 的 协议 ， 第 -- 个 实现 的 
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就 是 基于 ТСРЛР 协议 的 ， 他 们 把 它 和 包括 在 Unix 42 BSD KARE, HESARI FR RERE, 
这 在 因特网 的 历史 上 是 一 个 重大 事件 .几乎 一 卢 之 间 ， 成 千 上 万 的 人 们 接 卸 到 了 TCP c6 eges 
ы Ç 5] T EK643 3k, 3 X T 3 655] Sk br PS ЕВИЯ ЖИ. 


124.1 套 接 字 地 址 结构 

从 Unix 内 核 的 角度 来 看 ， 套 接 罕 就 是 通信 的 端点 end-point). M Unix 程序 的 角度 来 看 ， 套 接 
TRE -个 有 相应 描述 符 的 把 开 文件 。 

因特网 的 套 接 字 地 址 存放 在 如 图 12.15 所 示 的 类 型 为 sockaddr_in 的 16 字 节 结构 中 。 对 于 因 特 

网 应 用 ，sin_family 成 员 是 AF INTE, sin port 成 员 是 一 个 16 AmO. M sin_addr KRME 

^* 32 te I) TP ЖЕ. IP 地 址 和 端口 号 总 是 以 网 络 字 节 顺序 《大 端 法 ) 存放 的 。 

— —F .—n —— sackaddr: socketbits.h (included by socket.h). sockaddr in: netinivin.h 
/* Generic socket address structure [for connect, bind, and accept) %/ 
struct sockadeor 1 

unsigned short sa, familv; /* protocol Family */ 
char sa data[14]: /% address data. */ 
) 


[* lnternet-style socket address structure */ 
struct sockaddr 1л { 
unsigned short sin family; /* address family (always AF INET) */ 


unsigned short sin port; /* port number in network byte order */ 
Struct іп addr sin, гааг; /* IP address in network byte order */ 
unsigned char sin, zero[8]; /* pad to sizeofí(struct sockaddr) */ 


sockaddr: socketbits.h (included hy socket.h). sockaddr. in: netinivin.h 


E1215 ЖЕТИШИ 
in addr ЗАПЫ 12.9 Bis. 


gi: in ORTI 27 
An E SLE # XE 8 (inteme) HRS, MAERA біре) 66 3835. 


connect. bind Ж. accept 8:6 — ЧА ЕБ МУ ЕЕ ERE SS ЕНІНЕН. ЕТЕГІН 
RIA ШИН S, dixe МАША, [827 ERA ka ah ЕЕЕ ИШЕ. 今天， 我 们 可 
以 使 用 通用 的 void* 指 针 ， 那 时 在 C 中 并 不 存在 这 种 类 型 的 指针 。 解 决 办 法 是 定义 套 接 字 函 数 要 求 
个 指 问 通用 sockaddr 结构 的 指针 ， 然 后 要 求 应 用 程序 将 与 协议 特定 的 结构 的 指针 强制 转 谈 成 这 个 
表 出 结构。 为 了 简化 我 们 的 代码 示例 ， 我 们 跟随 Steven 的 指导 ， 定 义 下 面 的 类 型 ， 
typedef struct sockaddr SA; 


然后 尤 论 何 时 我 们 沉 要 将 sockaddr in 结构 强制 转换 成 通用 sockaddr 结构 时 ， 我 们 都 第 用 这 个 
RR (参见 图 12.16 的 第 20 行 的 示例 )， 


12.4.2 socket ЕЖ 
客户 疡 和 服务 器 使 用 socket 函数 来 创建 А28 38: (socket descriptor). 
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include «sys/types.h» 
iinclude «sys/ socket, h> 


int socketí(int domain, int type, int protoco.); 
退回: Элуй] ЖАР ЖИ, Gb] -L 

在 我 们 的 代码 中 ， 我 们 总 是 带 这 样 的 参数 来 调用 socket e Ж: 

clienzfd-SocketiAF INET, СОСЕ STREAM, O); 

Arp. AF INET 志明 我 们 止 在 使 用 因特网 ， 而 SOCK. STREAM ERER ЕКИ МЕННІҢ 
点 《end-point)。socket 返回 的 clientfd 措 述 符 仅 是 部 分 打开 ， 并 且 不 能 用 于 读 写 。 我 们 如 何 完成 打 
ЖЕЕ, Bx FII EE МЕН. Т— 邓 描 述 当 我 们 是 客户 端 时 如 何 宪 成 打开 套 
按 子 的 工作 ， 
12.4.8 connect 函数 

TET Im ДӘ АЕ connect Ж Ër k et v al ЕЕЕ. 


Rinclude «gsvs/socket.hs» 


int connect {ini sockfd, struct sockaddr *serv addr, int acdr]len i 
| 返回 : ЖАИ] 0, Ж ШЕЛ] 5-1. 

connect ARAE 5 和食 接 字 地 址 为 serv адаг WRA REU TAGANE, HB addrlen E 
stzeaf(sockaddr in). connect KA STE, — А ЗЕ ЁТ Sr k E RI ERE. 可 果 成 功 ，sockfd F 
述 行 现在 就 准备 好 该 写 Г. ЯН, GAEE E HEEN 

(ХІУ, Serv_addr,sin addr:serv addr.sin port) 
АНАН), AP x Kosa Passt) IP BERE, Пу 表示 临时 端 日 ， ЕЕ TIGRE ЕН ШЕЛІ 
进程 。 
12.4.4 open_clientfd 函数 

ETARE socket 和 connect 肯 数 包装 成 一 个 叫做 open_clientfd 的 辅助 函数 是 很 方便 的 ， 客 户 
师 品 以 用 宅 来 和 服务 器 建立 连接 ， 


tinclude "csapp.h' 


int open clientfd(char *hostname, int port); 


АМ] АЛЛА. + Unix 出 错 则 为 -1， 若 DNS 出 错 则 为 -2， 





open, clientfd PF Sr IR 25-38 $8 ҮЗЕ, АЛЫ ЕТ (E HL hostname. 上 ,并 在 知名 端口 роп 
ЕЛЕНА Ж. CRH -个 打开 的 套 接 字 描 述 符 ， 沪 描述 符 准 备 好 了 ， 可 以 用 Unix UO ЖЕ 
信和 和 输出。 图 12.16 给 出 了 open clientfd 的 代码 ， 





code/sre/esapp.c 
1 int open ciientfdi(cnar *hostname, int рогі} 
2 i 
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3 int clientfd; 

4 strucr hostent *hp; 

5 struct sockaddr in serveraddr; 

6 

Н if ((clientfd = socket {АЕ INET, SOCE STREAM, 01) < 0) 
В return -1; /* check errno for cause of error %/ 

g 

10 /* Fill in the server БІР address and port */ 

11 if ((ho = gethos;byname([hostname)] == NULL) 

13 return -2; /* check h errmo for cause of error */ 

13 bzero[(char *] &serveraddr, sizeofíserveraddr);; 

14 sServeraddr.sin family = AF INET; 

15 bcopy (ichar *]hp--h, айдаг, 

16 [char *)&serveraddr.sin addr.s addr, hp-»h, length); 
17 Serveraddr.sin port = htonsíport); 

18 

19 /* Establish a connection with the server */ 

20 if (connect (clientfd, (SA %) kserveraddr, sizeof(serveraddr)) < 01 
21 return -1; 

AA return clientfid; 

23 ! 


— € 


图 12.16 open clientfd: MRF sese ЕЕЕ 

在 创建 了 套 接 字 抄 述 符 ( 第 了 行 ) 后 ， 我 们 为 取 务 器 答 索 DNS 主机 条 日 ， 并 撕 风 主机 条 上 月 中 的 
Ә--МРЫН СС ДЕС Е ДРЕВО ә 到 服务 器 的 套 接 字 邮 让 结构 【第 11 一 16 行 )。 在 用 
技 照 网 络 字 节 顺序 的 服务 器 的 知名 端 品 号 初始 化 剖 接 字 地 址 结构 (第 17 行 ) 之 后 , 我 们 发 起 了 一 个 
到 服务 器 的 连接 请 求 “第 70 行 }。 当 connect HARON, ЖЛЛАМЕННАТУЕРІШ, ЖР 
ҚАЛ DEBIT 88 H] Unix UO 和 服务 器 通信 了 。 
12.45 bind 函数 

H ТЕЧ HM bind. listen 和 accept 被 服务 器 用 来 和 客户 端 建立 连接 。 


| #include <зуз/в^сскер.һ> 


code/src/csapp.c 


int bindiint sockfd, struct sockaddr *my addr, int acdrlen); 
ik XA: EO, EWID- 

bind 函数 告诉 内 核 将 my. адаг PR ГЕННЕН ИКРИМА soekfd 联系 起 来 。 参 数 
addrlen 就 是 sizeof(sockaddr in). 
12.4.6 listen 函数 

ЕРЕКЕ ЖЫ ЫЗА. 服务 器 是 等 待 来 自 客户 端的 连接 请 求 的 被 动 实体 。 默 认 情 
ñ F. ЧЕТА 37 socket 也 数 创 建 的 描述 符 对 应 于 主动 套 接 字 (active socket)， 它 存在 于 一 个 连接 
的 客户 端 。 服 务 器 调用 isten 函数 告诉 内 核 ， 描 述 符 是 被 服务 器 而 不 是 客户 端 使 用 的 。 
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"include «sys/socket.h- 


int listení(in: sockfd, int backlog): 


Ез: 车 成 功 则 为 0， 老 出 错 则 为 -]， 





listen 图 数 将 sockfd 从 一 个 主动 套 接 字 转化 为 “个 监听 宕 接 字 【listening socket), cg TE al D) 
接受 来 白 客户 冉 的 连接 请 求 . backlog 2л T ARTHA EMERARA ARAB h 5 
待 的 林 完 成 连接 请 求 的 数量 。baeklog SKERMS Ай ЖКА] ТСРЛР HARER, АШ ТП 
沦 的 汽 围 。 通 常 我 们 会 把 它 疫 冒 为 一 个 较 大 的 值 ， 比 如 1024, 


12.4.7 open listenfd 函数 
我 们 发 现 将 socket. bind 和 listen. HAH А open. listenfd A$ Bh eA S E: REL ТЕНИ]. 
服务 器 可 以 用 它 来 创建 ЕП ИЗ. 


*inciude "csaop.h" 


int open listenfdiint рогі}; 





АБ): 3b md» xu. 3 Unix 出 错 则 为 -1， 


open listenfd 37 HERREY АЛА y, IX Bub CHE ИЛЕШ Г pot 上 接收 和 连接 
Ж. ҢІ 12.17 Rios f open listenfd 的 代码 。 在 我 们 创建 了 вмеша 套 接 字 描 述 符 之 后 ， 我 们 使 用 
setsockopt ЮЖ CE HE RO ЖАСЫЛЫ, fei EBENE УЫ AREA., ЖАЛАШ, — HUS 
КЕ ЖЕ ХЕЧ ЗОРЫН ТЕЛЕН Ж. "ШИШИ Т Wii. 


code/src/esupp.e 


1 int open listenfdí(int port? 
2 i 
3 int listenfd, optval-1; 
Д struct sockaddr in serveraddr: 
5 
6 /* Create a socket descriptor */ 
Ч iE ((listerfd = socket {АЕ INET, SOCK STREAM, Üj) < O) 
8 return -1; 
9 
10 /* Eliminates "Address already in use" error from bind. */ 
11 if (setsockoptilistenfd, SOL SOCKET, SO REUSEADDRE, 
12 (const void *J&optval , sizeof(í(int)) < Ql 
13 return -1; 
14 
15 /* Listenfd will be an endpoint for all requests to port 
16 on апу ІР address for this host */ 
7 bzerotí(char *l&serzveraddr, sizeofí(serveraddr)); 
18 serveraddr,sin family = AF INET: 
19 serveraddr.sin addr.s addr = htonlíINADDRE ANY); 


20 serveraddr,sin port = htons((unsigned short!port); 
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21 itf (bind(iistenfd, ISA *)&serveraddr, sizeolisšserveraddr)i < 0) 
22 return -1; 

23 

24 ж Make it a listening socket ready to accept connection requests */ 

25 if (listen(listenfd, LISTENQ) < 0) 

26 return -1; 

2) return listenfd; 

AB | 


code/src/csapp.c 
图 12.17 open listenfd: ТЖО ЕТЕР ВО ИВЕ 


ТЭ, 我们 初始 化 服务 器 的 套 接 字 地 址 结构 ， 为 调用 bind 函数 做 准备 。 在 这 个 例子 中 ， 我 们 
用 INADDR_ANY 通配符 地 址 来 告诉 内 核 这 个 服务 器 将 接受 来 自 这 台 主 机 的 任何 IP 地址 (第 9470 
和 到 知名 端口 роп (Ж 20 行 ) 的 请 求 。 注 意 ， 我 们 用 Мон! 和 htons AYUS ІР ЖА ОБЛА ЕМ, 
字 节 顺序 转换 为 网 络 字 节 顺序 。 最 后 ， 我 们 将 listenfd 转换 为 一 个 监 昕 描述 符 CB 25 行 )， 并 将 它 
返回 给 调用 者 ， 


12.4.8 accept 函数 
服务 器 通过 调用 accept 图 数 来 等 待 来 自 客户 端的 连 接 请 求 ， 


#inciude <sys/socket.h. 


int accept {int listenfd, struct sockaddr *addr, int *addrlen); 


Ағ) БАЛАДАН, Zub». 


accept ЖЕЕ ЖН ЖГ Ew PE BET CK 34. f rd Е listenfd, 然后 在 addr UR EU Pm PE: 
ЖУНШ. ЭНА [81—71 C it БЖ (connected descriptor), BARR ЕНЕН ЖАШ Unix VO K 
rs Ps fs. 

БАТАНЫ Be PEZ Taf ЯНВ Ж e EXER. WHERE EE EP mia 
求 的 一 个 端点 。 典 型 地 ， 它 被 创建 一 次 ， 并 存在 于 服务 器 的 整个 生命 周期 。 己 连接 措 述 符 是 客户 端 
和 稻 务 十 之 间 已 经 建立 起 来 了 的 连接 的 一 个 端点 ,服务器 每 次 接受 连接 请 求 时 ， 都 会 创建 一 次 ， 只 
存储 十 服务 器 为 一 个 客户 疾 服 备 的 过 程 中 。 

图 12.18 Hita T mU HXRTEDOERBHSXOSTHNIBE. EA oom. ДЕЗ Н acep, ЗЕ 
Ен K BHAI BAS, RAER E НКЗ. BHL - 下， 描述 符 0~2 预 留 给 了 标准 文件 。 

在 第 二 步 中 ， 客 户 端 调用 connect В, EE: -个 连接 请 求 到 Ustenfd。 第 三 步 ，aecept Т 
ЖТ ÓMERU COEBGRXRTT connfd CRIB REREH 4)， 在 clientfd 和 connfd LAHEY EE, Jf 
H BB Jc Xx ET connfd £v FH ERIT. АЕ M, connect 返回 ， 在 这 一 点 以 后 ， 客 户 端 和 服务 器 就 分 别 
HJ PAS LEE elientfd 和 connfg 来 回 传送 数据 了。 


旁 注 ， 为 何 要 有 监听 描述 符 和 已 连接 描述 符 之 间 和 的 区 别 ? 
МЕЛ AE НАКН ТВО Ы е АН, E-A, AAEE 
HIRE, Hom, Kiki kaki EN NS, Юэ ИП UM UAE. CE 
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肝 处 理 许多 客户 端 连接 ， 例 如 ， 每 次 一 依 过 接 请 求 到 达 监 听 撕 述 苦 时 ， 我 们 可 以 派生 【fo 率 ] 一 个 
新 的 进程 , CRITA LERRA SAPRA, 你 将 在 第 13 章 中 学 习 更 多 关于 并 党 服务 器 的 内 
Ж. 


ligtenfdiíi) 


L 35-5093 ФЕ accept, 等 符 监 听 撒 


^ St Кж 述 符 listenfd 上 的 连接 请 求 。 


eclienkfd 


ЕТТЕРИ K Kk 1..1.............. = ld «««.........-...“. шшш шшш =========== ==== -- 


uo -— e = = » 2. Ж P^ И AE RI ҰЯ: connect, 
ЖР "m 创建 连接 请 求 ， 


ligtentdi3)] 
Д 3. ВЗЯЛА accepi АІ сота. Ж 
ЖР Ра ЈА connect 返回。 现在 在 clientfd 
和 connrd 2 [B [327 8£ cg a HE. 


clienttfd conn£di4] 
图 1218 监听 描述 符 和 已 连接 描述 符 的 角色 


12.49 echo 客户 端 和 服务 髓 和 的 示例 

学 习 套 接 字 接口 的 扳 好 方法 是 研究 由 例 代 码 ， 图 12.19 展示 了 一 人 echo ЖИИ. ERI 
Е ЛЕВИ т, РАНА ЕЮ, БЫ ЛЕЛ У т, 发 送 交 本 行 给 服务 器 ， 
从 服务 器 旋 取 啊 应 行 ， 并 输出 结果 到 标准 输出 。 当 fgets 在 标准 输入 上 过 到 EOF 上 时， 或 者 因为 用 
РОА А ctrl-d, 或 者 因为 在 一 个 重 证 网 的 输入 文件 中 用 尽 了 所 有 的 文本 行 时 , 循环 就 终止 。 

箱 环 终 让 之后， 客户 端 关闭 描 读 符 。 这 会 导 咎 发 送 一 个 БОЕ 通 千 到 服务 器 ， 尖 服务 器 从 它 的 
rio readlineb 摧 数 收 天 一 个 为 零 的 返回 码 时 ， 就 会 检测 到 这 个 结果 。 在 关闭 它 的 描述 符 后 ， 客 户 端 
MEET. 紫 然 客户 端 内 核 在 一 个 进程 终止 时 会 自动 关闭 所 有 打开 的 描述 答 ， 第 24 行 的 close 就 没 
НЕТ, 不 过 ， 显 式 地 关闭 我 们 已 经 打 升 的 任何 描述 符 是 一 个 良好 的 编程 习惯 。 


code/netp/echoclient.c 
1 #include "csapp.h" 
2 
3 int mainí(int агас, char **argv) 
4 í 
5, int clientfd, port; 
5 char *host, buf [MAXLIHE]; 
7 rio t rio; 
Н 
3 LĒ (ағас [= 3] 1 
10 fprintf(sLderr, "usage: $s «host» «port»'in", argv|0]); 
1] exiti(0): 
12 } 
13 host = argv[i]; 
14 port = atolíargví2]); 
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15 

l& clientfd = Open clientfdi(host, port); 

17 Rio.readinitbí&rioa, clientfd); 

18 

19 while (Fqetsibuf, MAXLINE, stdin) ‘= NULL) í 
20 Hio writeni(clientfd, buf, strlenibuf)); 
21 Rio readlinebi&rio, buf, MAXL INE); 

22 Fputs (buf, stdout); 

23 } 

23 -losei(clienttd); 

25 ехіїћ {0}; 

2500) 


code/netp/echoclient. c 
图 1219 echo 客户 端的 主 程序 
图 1220 ER 7 echo 服务 器 的 卡 程 序 。 在 打开 监听 描述 符 后 ， 它 进入 -AERA БИХАН 
都 等 符 - -个 来 自 客户 端的 这 接 请 求 ， 输 出 已 连接 客户 端的 域名 和 IP 地 址 ， 并 测 用 echo 函数 为 这 些 
Z WRA. t echo ЖАБ Е, ЕЭС СЕ ВЧК. Не РАВ Н ГЕ В 
Ву Т, ЕНЕМЕ Т. 


code/netp/echoserveri.c 


1 #include "csapp.h" 

2 

3 vold echoiint сонпҒа): 

4 

b int main(int агас, char **argv) 

5 i 

7 int listenfd, connfd, port, clientlen: 

H struct sockaddr in clientaddr; 

5 struct hostent *hp; 

10 char *hadüdrp: 

11 if (ағас != 2) í 

12 tprintfistderr, "usage: ЖӨ eport»\n', argvl[0]!; 

13 exití(0); 

14 ) 

I5 port = ао1{агау[1]); 

15 

17 listenfd = Open listenfdíport]; 

18 while i1) Í 

19 clientlen = sizeofíclientaddr!: 

20 connfd = Acceptilistenfd, (SA *l&clientadadr, &clientlen); 

21 

22 /* determine the domain name and IP address of the client */ 

23 hp = Gethostbyaddr((const char *'&clientaddr.sin addr.s addr, 
24 sizeot(clientaddr.sin addr.s addr),AF, INET); 
25 naddrp = inei ntoaí(clientzddr.sin acdr); 

26 brintfí"server connected to ts {%9)\п", hp-»h name, haddrp): 
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28 echo(conntd):; 
28 Closs(connfd); 
30 | 

11 ехікій); 

34027) 


code/neip/echoserveri.c 
1220 Ж echo 服务 路 的 主 程序 
注意 ， 我 们 的 简单 的 echo JR S9 8S — 2A A ВЕЗЕ И ER. 这 种 类 型 的 服务 器 一 次 一 个 地 在 窜 
БІН, ЖАНА (iterative server). TEX 13 章 中 ， 我 们 将 学 习 如 和 何 建立 更 如 复杂 的 并 
Ж ЛЕ 4-29 (concurrent server), 17 ВЕЖ [a] I] Ab PE E TA 


Ah. B 12.21 R J echo EFAA, Per ME ХУЖА), BEI rio readiineb ЖЕЗ 
10 fr38 $] EOF. 


TT code/netp/echo. C 
1 finclude "csapp.h" 
à 
j void echoiint connfd) 
4 { 
5 51е bL n; 
6 char buf [MAXLINE]; 
f rio t rio; 
ü 
9 Rio readinitbí(&rio, connfd); 
11 whileiin = Rio readlineb(&rio, buf, NAXLINE]) !- QJ Í 
11 printfí("server received #9 bytesin", n); 
12 Rio writen(connfd, buf, nh; 
13 ] 
14 | 


code/netp/echo.c 
图 1221 读 和 回 达 文本 行 的 echo 函数 


mui. 在 连接 中 EOF KRHA? 

EOF 的 概念 常常 他 学 生 们 感到 迷惑 ， 克 其 是 在 因特网 连接 的 上 下 文中 ,首先 ， 我 们 需要 理解 其 
实 并 没有 像 БОЕ 字符 这 样 的 一 个 东西 。 进 一 步 来 说 ，BOF 是 由 内 核 检测 到 的 一 各 条件。 应 用 程序 
在 它 接 收 到 一 个 由 read Ете ад, bak ih EOF $. AFAEL, SAÈ 
忻 位 置 超出 文件 蕉 度 时 ， 仗 发生 EOF。 对 于 因特网 和 连接 ， 当 一 个 进程 美 闭 连接 在 它 的 那 一 端 时 ， 会 
发 生 БОЕ. 连接 另 一 端的 进程 在 试图 读 取 流 中 最 后 一 个 字 节 之 后 ， 会 检测 到 БОЕ, 
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运 分 为 止 , 我们 已 经 讨论 了 一 个 简单 的 echo 服务 器 了 下 文中 的 网 络 编程 。 在 这 一 节 串 ， 我 们 将 
呵 你 展 小 如 何 利用 网 络 编程 的 基本 概念 ， 来 创建 你 自己 的 虽然 小 但 是 屿 能 齐全 的 Web 服务 器 。 
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12.5.1 Web 基础 

Web $^ Ya BR ЕСЕМ КЕНЕ А РУ ЛУН НИИ, ШҚ HTTP CHypertext 
Transfer Protocol. iir PRA. HTTP Æ- А УЙ. — Web ЕЛІп Og ie, s 
ҮН-Т ӘКЕМЕ, AARET. ВЕ ВЕДЫ ЛУ АТТА Ж ВР, Ue Xe. 
Е ВЕНЕ АА, ДУЕТ W tr Ese С. 

Web 服务 和 和 党 规 的 文件 检索 服务 【例如 FTP) НЕГА ж ЭШ? ЕК С ДЕ Web 内 容 可 以 用 一 
种 叫做 HTML (Hypertext Markup Language, 超 文 本 标记 语言 ) 的 语言 来 编写 。 一 个 HTML 程序 5 页 ， 
包 仿 指令 《标记 从 ;>， 它 们 告诉 浏览 占 缉 何 显示 这 山中 的 各 种 交 本 和 图 形 对 象 。 例 如 ， 民 坦 


¿P> Make me bold! «Б> 


吉 诉 浏览 器 用 粗 体 字 类 型 输出 <b> 和 <Pmb> 标 记 之 间 的 文本 ， 然 而 ，HTML 真正 的 强大 之 处 在 于 一 个 
页 面 可 以 包 舍 指针 《 超 链 把 7)， 这 些 指 针 可 以 措 同 存 胡 在 任何 因特网 主机 上 的 内 容 。 例 如 ， 一 个 格 云 
如 下 的 HTML 行 


а href-"http://www.cmnu.edu/index.html"»Carnegie Mellonz/a» 
УЙДЕ Sun: ЕОС. "Camegie Mellon", НЕ“ — ABE RE, ҰНЫ ЫЫ CMU Web 
服务 器 了 上 叫做 index.htm) 的 HTML cfr. WRA АЕ Y Pa АЖА, ҰЯ СМО 服务 
器 中 请 求 相应 的 HTML 文件 ， 并 显示 它 。 


$i. ЛЕ НЫШ 

万 维 网 是 Tim Berners-Lee Ж, E — 4k 4E x e Ж x e CERN (欧洲 辣子 物理 研究 所 ) 
工作 的 软件 工程 师 。1989 +, Bemers.Lee 写 了 一 个 内 部 备 总 录 ， 担 出 了 一 个 分 布 式 超 文本 系统 ， 它 
$5: НАН ҰЗЫН (web of notes with links 站， 提出 这 个 系统 的 目的 是 帮助 CERN 的 科 
学 家 共享 和 营 理 信息 . 在 接 下 来 的 两 年 多 里 ，Bermers-Lee 实 更 了 第 一 个 Web 服务 器 和 Web 浏览 器 
之 后 ， 在 CERN 内 部 以 及 其 他 一 些 网 站 中 ，Web 发 展 出 了 小 规模 的 拥护 者 。1993 年 一 个 关键 事件 发 
ЖТ. Marc Andreesen ( 后 来 创建 了 Netscape ) 和 他 在 NCSA 的 同事 发 布 了 一 种 图 形 化 的 浏览 器 ， 
945 MOSAIC, 3T» Xi z ftx Ea GA: Unix. Windows # Macintosh, 在 MOSAIC X E, 
对 Web 的 兴趣 爆发 了 , Web 网 站 以 每 年 10 de d e YK. 5] 2002 年 , 已 经 有 超过 36 000 000 
ЕЛЕНЕ Web 网 站 了 С 8 www.neteraft.com 的 Netcraft Web 调查 ). 


12.512 Web 内 容 
村 于 Web 客户 端 和 服务 器 而 言 ， 内 容 是 与 -个 MIME (Multipurpose Internet Mail Extensions, 
£ REINES REFS ЕТ) 类 型 相关 的 字 节 序列 。 图 12.22 展示 了 一 些 常用 的 MIME 类 型 。 


text. html HTML 7 ІҢ 
text:plain ЖАУ Е 


application/postscript PSx Ei 
image/gif GIF 格 式 编码 的 二进制 图 你 
image; jpeg JPEG Fr yv A ROS) H hi @ 





图 12,22 MIME 类 型 示例 
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Web Jl АРАНЫ АА ВЕБЕ: 

e ЕНУ, PRERANE EPI. ЖУАН. (static content), 
kin X PESE EP s PUL Pa ER АЛИ ЫАЖ Ж. (serving static content? 

ә 运行 -个 可 执行 文件 ， 并 将 它 的 输出 返回 给 客户 端 。 运 行 时 可 执行 文件 产生 的 输出 称 为 动 
SAE (dynamic content)， 而 运行 程序 并 退回 它 的 输出 到 客户 端的 过 程 称 为 服务 动态 内 容 
(serving dynamic content >, 

每 条 由 Web 服务 器 返 四 的 内 容 都 是 和 它 管理 的 某 个 文件 相关 联 的 。 这 些 文件 中 的 每 一 个 都 有 - ` 

TEMAT. M URL (Universal Resource Locator， 通 用 资源 定位 罕 )， 例 如 ，URL 


http://www.aol.com:8D/index.html 


表示 因特网 主机 wwwaol.com 上 一 个 称 为 /index.html 的 HTML X fF, € E — 351p 80 X8 C183 Web 
服务 器 管理 的 。 端 口号 是 可 选 的 ， 而 知名 的 HTTP 默认 的 端 订 就 是 80, rof] ri URL 可 以 在 
充 件 名 后 了 包括 种 序 参 数 。*?” 字 符 分隔 文 件 名 和 大 数 ， 而 日 每 个 参数 者 用 “区 ”字符 分 并 开 。 例 如 ， 
URL 


http://kittyhawk.cmcl.cs. cmu.eGu:8000/cai-bin/adder?215000&213 
标识 了 一 个 叫做 jegi-binfaddr 的 可 执行 文件 ,会 带 两 个 参数 字符 串 15000 81213 来 调用 它 , 在 事务 过 
Ей, ЖКА ЖЕШИНЕ URL BJ ASS y, 55 APER 


НЕсрі/ чик. асі.сот:80 


XUOE ЭШЛЕ Ж, ЖЗНЕ, ШЛ ЕТ НЫ S E m. ЖӘНЕН 


/index.htmi 


来 发 现 在 它 文件 系统 中 的 文件 ， 并 确定 请 求 的 是 静态 内 容 ， 还 是 动态 内 容 ， 

关于 服务 器 如 何 解释 一 个 URL 的 后 缀 ， 有 三 点 需要 理解 

ө 确定 一 个 URU 指 网 的 是 表态 内 容 还 是 动态 网 容 没 有 标准 的 规则 , 每 个 最 务 器 对 它 拨 管理 的 
文件 帮 有 日 己 的 规则 。 一 种 常见 的 方法 是 ， 确 认 -组 日 录 ， 例 如 cgi-bin， 所 有 的 可 执行 性 
X f BUD DU TOROES B жап. 

е JEDE BEDS "7" 不 表示 Unix 的 根 日 录 。 相 反 ， 它 表示 的 是 被 请 求 内 容 类 型 的 主 
Нож. 例如 ， 吕 以 将 一 个 服务 器 配置 成 这 样 所 有 的 静态 内 容 存 放 在 目录 Aspmhttpdyhtml F, 
而 所 有 的 动态 内 容 都 存 舟 在 日 菏 /ustihttpsicgi-bin F. 

《最 小 的 URL 后 织 套 “/” 学 符 ， 所 有 服务 器 将 其 扩展 为 某 个 默认 的 主页 ， 便 如 /index.html，。 
这 解释 了 为 秆 么 简单 地 在 浏览 器 中 键入 -个 域名 就 可 以 取出 一 个 网 站 的 主页 。 浏览 器 在 
URL 后 添加 缺失 的 “/*， 开 将 之 传递 给 服务 器 ， 服 务 器 义 把 “/” 扩展 到 某 个 默认 的 文件 
Ж. 


12.5.3 HTTP 事务 

因为 НТТР 是 基于 在 因特网 连接 上 传送 的 文本 行 的 ， 我 们 可 以 使 用 Unix 的 TELNET 程序 来 和 
任何 因特网 上 的 Web 服务 器 执行 事务 。 对 于 调试 而 连接 上 通过 文本 行 来 与 客户 端 对话 的 服务 器 来 
І, TELNET 种 序 昨 非常 便利 的 。 列 如 ， 图 12.23 使 用 TELNET 向 AOL Web 服务 器 请 求 主 页 ， 
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1 ип1х> telnet www.aol.com 80 Ciient: open connection to server 
2 Trying 205.188.145,23... Telnet prints 3 lines to the terminal 
4 Connected to aol,camr. 

4 Escape character is 77)». 

5 GET / ҢТТЕ/1,‚1 Client: request line 

б host: www.aol.com Client: required HTTP/1.1 header 

7 Client: empty line terminates headers. 
8 НТТР/1.0 200 OK Server: response line 

9 MIME-Version: 1,0 Server; followed by five response headers 
10 раге; Mon, 08 Jan 2001 04:59:42 GMT 

11 Server: NaviServer/2.0 AOLserver/42.3.3 


12 Content-Type: text/html Server: expect HTML in the response Бойу 


13  Content-Length: 42092 Server: expect 42,092 bytes in the response body 
14 Server: empty iine terminates response headers 
15 <html> Server: First HTML line in response body 

15 ... Server: 756 lines of HTML not shown. 

l/  «/html» Server: last HTML iine in response hody 

18 Connection closed by foreign host. Server: closes connection 

19  unix- Client: closes connection and terminates 


1223 一 个 服务 静态 内 容 的 HTIP 事务 


在 第 一 行 ,我 们 从 Unix shell 运行 TELNET, 要 求 它 打开 一 个 到 AOL Web 服务 器 的 连接 .TELNET 
阿 终 疗 打印 三 行 葡 出 ， 打 开 连 接 ， 然 后 等 符 我 们 输入 文本 【第 5 行 )。 每 次 我 们 葵 六 一 个 文本 行 ， 并 
EAER, TELNET SRRI FREWER E C HRR PA “ro”, HE. 
ЖОХ —A ЖЕЗ. ЖЕЛІ HTTP 标准 相符 的 ，HTTP ЖК САТ Н El 4 AR 
行 符 对 来 结束 。 NT Ades. 我 们 输入 一 :个 HTTP 请 求 (第 5~7 行 ),。 服务 器 返回 HTTP UV. (第 
8 一 17 行 )， 然 后 关闭 连接 (Ж 181ү). 

HTTP 请 求 

— HTTP 请 求 的 组 成 是 这 样 的 ， 一 个 请 求 行 (request line]【 第 5 行 )， 后 面 跟随 零 个 或 更 多 
ARIA (request header)【 第 6 行 )， 肯 跟随 一 个 字 的 文本 行 来 终止 报头 列表 (第 了 行 )。- - 们 请 
求 行 的 形式 是 

<methóoc><url><version> 


HTTP ЕЛ ЛЕНЕ Л Ж. 包括 СЕТ, POST, OPTIONS. HEAD. PUT, DELETE 和 TRACE。 
我 们 将 只 讨论 广 为 应 用 的 GET ЛЕ, ШЙ ЖЕРИК, wd] 999 КІ HTTP ië [79], GET 方法 指 
导 服 务 器 生成 和 返回 URI (Uniform Resource ldentifier， 统 一 资源 标识 符 ) 标识 的 内 容 。URI 是 相应 
的 URL 的 后 缘 ， 包 括 文件 名 和 而 选 的 参数 。* 

请 求 行 中 的 <version> 宇 段 表 明了 该 请 求 遵循 的 НТТР 版 本 。 最 新 的 НТТР 版 本 是 HTTP/L1[271. 
HTTP/1.0 是 从 1996 年 沿用 至 邻 的 老 版 本 。HTTPILI 定 六 了 一 些 阶 坑 的 报关 ， 为 诸如 缓冲 和 安全 等 
商 级 笠 特 提供 赤 持 ， 它 还 支持 一 种 机 制 ， 人 允许 突 户 端 和 服务 器 在 同一 条 持久 连接 (persistent 


2 实际 上 ， 只 有 当 浏 览 器 请 求 内 容 时 ， 才 会 这 样 。 如 果 代 理 服务 器 请 求 内 容 ， 屠 名 UR 必须 是 完整 的 URL. 
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connection) 上 执行 多 个 事务 。 和 在 实际 中 ， 两 个 版 本 是 互相 兼容 的 ， 因 为 HITP71.0 ЕРІННІҢ AS 
器 会 简单 地 忽略 HTTP/1.1 的 报头 。 

总 地 米 说 ， 第 5 行 的 请 求 行 暴 求 服务 器 取出 并 返回 HTML X #Fñndex.html, * E 5 XU HR 3 8818 
求 镜 下 有 的 部 分 是 HTTP/1.1 AN. 

请 求 报头 为 服务 器 提供 了 狗 外 的 依 昌 ， 葬 如 浏览 器 的 商标 名 ， 或 者 浏览 器 理解 六 MIME X. 
RR E TRAA 

<пеайег name>: «header data» 

针对 我 们 的 日 的 , 惟一 需要 关注 的 报头 是 Host 报头 【第 6 行 )， 这 个 报头 存 НТТРЛ.1 请 求 中 是 
需要 的 ， 而 在 HTTP/1.0 请 求 中 是 不 需要 的 。 代 理 缓存 (proxy cache》 会 使 用 Host 报头 ， 这 个 代理 
缓存 有 时 作为 浏览 器 种 管理 被 请 求 交 件 的 原始 服务 器 (origin server) 的 中 介 。 客 户 端 和 原始 服务 器 
之 间 ， 可 以 有 多 个 代理 ， 即 所 请 的 代理 链 《proxy chain). Host 报头 中 的 数据 ， 指 示 了 虎 始 服务 器 的 
域 儿 ， 使 得 代理 链 中 的 代理 能 够 判断 它 是 否 可 以 措 有 一 个 梳 请 求 内 容 的 本 批 组 存 的 副本 。 

ЖАВИ 1223 中 的 示例 ， 第 7 行 的 空 文本 笨 【 通 过 在 我 们 的 键盘 上 键入 回 车 键 生 成 的 ) 终 
上 了 报头 ， 并 指示 服务 器 发 送 被 请 求 的 HTML 文件 。 

HTTP #8} 

НТТР 1/7 #1 HTTP 请 求 是 相似 的 ,一 :个 НТТР ПУ EHE ЕНІН: 个 响应 行 (response line) 
CR B ir), 后 面 跟 甩 着 零 个 或 更 多 的 响应 报关 (response header) C 9—13 47), BRETA iE f8 
RARI СЖ 14 行 )， 冉 跟随 一 个 响应 主体 《response body) (第 5 一 说 行 )。 一 -个 坑 应 行 的 格式 是 

«version» «status code» «status message» 

MW Ur BERE] Sena ДУ Pra Р HTTP 版 本 ，status code [状态 码 ) R. ЕК, RR 
对 请 求 的 处 理 。status message 状态 消息 ) ЖШ БЕШ УІ. B] 1224 列 出 了 一 些 
前 见 的 状态 否 ， 以 及 它们 相应 的 销 息 。 

20 — | mh 处 理 请 求 无 训 
Ж A Hah 内容 品 移 动乱 位 置 关中 指明 的 主机 上 

















SOR DK НЕ de^ BE КИТА ЖК 

Жа 服务 器 七 权 访问 所 请 求 的 文件 
ABI 上 服务 器 小 能 找到 所 请 求 的 文件 
未 实现 3 D ж Fih k bu ЛЕ 





НТІРМАЗЖЕ Wie SR ж EARS SF Ж 


12.24 -ЕНПР 状态 码 


Ж 9--13 ТПМ Sue Ot F'XCT NE АОН nda Rh. ИЕП АО, ММЕН 
Content-Type. (CR 12 17), ERWA Psi x er ІМ MIME 类 型 ， 以 及 Content-Length (第 
13 行 )， 用 来 指 小 响应 主体 的 学 节 大 小 。 

第 14 行 的 终止 响应 报头 的 空 文本 行 ， 其 后 跟随 着 响应 主体 ， 响 应 主体 中 包含 着 被 请 求 的 内 容 。 
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1254 服务 动态 内 容 

如 果 我 们 停 下 来 考虑 一 下 ， 个 服务 器 是 如 何 癌 客 户 端 提 供 动态 内 容 的 ， 就 会 发 现 一 些 问 题 。 
例如 ， 窜 户 端 如 何 将 程序 参数 传递 给 服务 器 ? 服务 器 邵 何 将 这 些 参数 传递 给 它 所 创建 的 子 进程 ? 最 
务 器 如 何 将 子 进 程 生 成 内 容 所 舌 要 的 其 他 信息 传递 给 于 进程 ? 子 进 往 将 它 的 输出 发 送 到 哪里 ? 一 个 
称 为 CGI (Common Gateway Interface, i 19436911) 的 实际 标准 的 出 现 解决 了 这 些 问题 。 

2€ F3 Ue ERU S EC ТЫЛ АН E? 

GET WRES Wa OE URI 中 传递 。 正 如 我 们 看 到 的 ， ОТ “Т” CERES Т X. Н, ПІЗ 
ФА “&” РУЛ. ӘЖТЖАЛІРН Қ, MEDAR 920" ЖЖ. ЯН 
他 特殊 宇 符 ， 也 存在 着 相似 的 编 汉 ， 

ӘРІ: 在 HTTP POST 请 求 中 传递 参数 
HTTP POST 请 求 中 的 参数 是 在 请 求 主体 (request body FP ARA URI 中 传递 的 ， 


m sra n fo pe Pe АРА ER 

任 服 务 器 接收 一 个 如 下 的 请 求 后 

GET /cgi-bin/adder?15000&213 HTTP/1.1 

L LR] fork 来 创建 一 个 子 进 程 ， 并 调用 execve ТЕ 子 进程 的 上 下 文中 执行 Kgi-binyadder ЖР, 19 
adder AHF BE FE, ЖЕУ СО 程序 ， 羽 为 它们 遵守 CGI ЕНДІ. 而且， 因为 许多 CGI H 
序 是 用 Perl А5857, ЯТЫ CGI 程序 也 常 被 称 为 CG1 Ж. (CGI script)。 在 调用 execve 之 前 ， 
闻 进 程 将 CGI 环境 变量 QUERY STRING OX “150004213”, adder 程序 在 运行 时 可以 用 Unix 
geienv АЙ ЖӨНҮ. 


НАНЫН RE A5 ТІ? 
COI 定义 了 大 量 的 其 他 环境 变量 ， -个 CGI 程 序 在 它 运 行 时 , ПАН АХЕНУ. KL 1225 
给 出 了 其 中 的 -部 分 。 





















QUERY STRING 
SERVER_PORT 
REQUEST_METHOD СЕТВЕРСО8Т 

КЕМОТЕ HOST | Р 

REMOTE_ADDR $5 P3 [9 ЕВРА ЕР 
CONTENT. TYPE 只 对 POST 而 言 ， 请求 体 的 MIME 光 型 
CONTENT LENGTH 内 对 POST fü: ЖЕНГЕ ДК 


图 12.25 CO Ó TE D 

ТЕРКЕН ЖАНЫН? 

-个 CGI 程序 将 它 的 动态 内 容 发 送 到 标准 输出 。 在 子 进 程 加 载 并 运行 CGI 程序 之 前 ， 它 使 用 
Unix dup? 两 数 将 标准 输出 重 定向 到 和 客户 端 相关 联 的 已 连接 描述 符 。 因 此 ， 任 何 CGI 程序 写 到 标 
TE LE] Zr PED LEES EP 

ЕШ, ЮАР Л SUB RES БИН МЕН ХА, ПО ТЕНЕЙ 


FS 
XX ENT ry LI 
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Content-type 和 Content-length WERK, ЕЈ. 


图 1226 展 水 了 一 个 简单 的 CGI 程序, CHATEA ЖЕ, Slip e RES HTML АА Р 


(i. В 12.27 展示 了 一 个 HTTP 事务 ， 它 从 adder 程序 提供 动态 内 容 。 





~) cn A oa м RJ ғ 


unix» Есіпсе kittyhawk.cmcl.cs.cmu.edu 80600 
Tryirg 128.2.194.242.,, 

Connected to kittynawk.cmcl.cs.cmu.edu. 
Escape Character is '^]'. 

GET /cgi-bin/aüdder?15000&213 HTTP/1.0 Client; request line 


code/neip/riny/cgi-hin/adder.c 
finclude "csapp.h" 


int nainí(void! | 
char *buf, *p: 
char argl[MAXLINE), arg2[MAXLINE], content|[MAXLINE]; 
int пі-0, n=; 


/* Extract the two arguments */ 
if ((buf = getenv("QUERY STRING")) != NULL) { 


р = strchrí(buf, '&']; 
“P= Сар”; 
strcpy(argl, buf): 
strcpviarg2, p«1); 

пі = atoi;argl): 

na = асо1'агд2); 


/* Make rhe response body %) 
sprintf(content, "Welcome to add.com: "); 


sprinti (content, "*sTHE Internet addition portal.*r*n«p»", content]; 


sprintf(content, "€sThe answer is: $d + Жа = &dMrinzeps'", 
content, nl, nz, nl - n2): 
sprintficontent, "*sThanks for visiting!*sr^in", content]; 


ж Generate the HTTP response */ 

printfi"Content-length: tdirir", str'.ení(content)); 
printf("Content-Lype: text/htmlirNnirsn"); 
printfi"*s", content]; 

tfilushistdout); 

exit 0]; 


图 1225 ”对 两 个 整数 求 和 的 CG EA 


Client: empty line terminates headers 


HTTP/1.0 200 OK Server: response line 


code/netp/tiny/cgi-bin/adder.c 


Client: open connection 
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8 Server; Tiny Web Server Server; identify server 

9 Content-length: 115 Adder: expect 113 bytes in response body 
17 Content-type: text/html Adder: expect HTML in response body 
11 Adder: empty line terminates headers 


12 Welcome to add.com: THE Internet addition portal. Adder; first HTML line 
13 «p»The answer is: 15000 + 213 = 15213 Adder: second HTML line in response body 


14 zp»Thanks for visiting! Adder: third HTML line in response body 
15 Connection closed by [crelgn host. Server: closes connection 
15 unix» Client: closes connection ана terminates 


61227 一 个 提供 动态 HTML 内 容 的 НПР 事务 


i. # HTTP POST WR Fie p Mie СО 程序 
对 于 POST ЖЖ. ТЕНЬ УЕД Alka pP kikiki. СОВА ВА РТ 
с Ж. Ку 


1$ 5) 125 


£11.95, AU EIU XT ENG S F] P 48 F] СД ПО АЖ GE. Am. EB) 12.26 中 
的 CG 程序 却 能 没有 尾 何 司 题 地 使 用 标准 DO, X frase? 


126 综合 ，Tiny Web 服务 器 


我 人 通过 创建 -一 个 虽然 小 但 是 功能 齐全 的 称 为 Tiny 的 Web 服务 器 来 结束 我 们 对 网 络 编程 的 讨 
i£. Tiny ECARRI. CEE 250 行 代码 中 ， 它 结合 了 许多 我 们 已 经 学 习 到 的 思想 ， 例 如 进 
程控 制 、Unix VO, ETT HELM HTTP. 虽然 它 缺乏 一 个 实际 服务 器 所 具备 的 动能 性 、 稳 定性 币 安 
EE НЕН ЖА ы Web 浏览 器 提供 静态 和 动态 内 容 。 我 们 鼓励 你 研究 它 ， 并 斤 自 己 实 
现 它 。 将 一 个 实际 的 浏览 器 指 风 你 自己 的 服务 器 , 看 着 它 显示 - -个 复杂 的 带 有 文本 和 图 片 的 Web 页 
面 ， 真 是 非常 令 人 兴 亩 《甚至 诸 我们 这 些 作者 来 说 ， 也 是 如 此 1)。 

Tiny 的 main 程序 

图 12.28 展示 了 Tiny 的 主 程序 ，Tiny 是 - -个 移民 服务 器 ， 监 昕 在 命令 行 中 确定 交 端 UU 上 的 连接 
їн Ж. ЖШ open listenfd 基数 打开 -ARRERA Tiny ФИТ dl ДЫШ ЭМЕН. 
区 复 地 接受 一 个 连接 请 求 (第 31 行 )， 执 行事 务 《 第 32 行 )， 并 关闭 连接 的 它 于 -一端 (33345). 


code/netp/tiny/tiny.c 





/ * 
* tny.c - Á simple, iterative HTTP/1.0 Web server that uses the 


* GET method to serve static and dynamic content. 
ку 


tinc ude "csapp.h" 


void doit(int Ға); 
void read requesthdrs(rio t *rpi; 
ІЛЕ parse urlí(char *uri, char *filename, char *cgiargs); 


O © c] C nou L2 M ҥе 
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ІП void serve staticíint fd, char *fiiename, int Illeslze); 
11 void get filetypel(cnar *filename, char *filetype); 


12 void serve dynamicí(int fd, char *filename, char *cgiargs); 


13 void clienterror(int fd, char *cause, char *errnum, 


14 char *shortmsg, char *loóngmsq); 
15 

16 int mainí(int arge, char **argv! 

1? i 

18 int listenfd, conrfd, port, clientlen: 

13 struct sockaddr ir clientaddr; 

20 

21 /* Check command line args */ 

22 1f (ағас != 2) í 

23 fprintfí(stderr, "usage: $s «port»in", argv[0]); 
24 exití(1); 

25 } 

26 рогі = &toilargv[1]): 

27 

28 .istenfd = Open, iistenfd:port); 

29 wnile 11101 

30 cilentl]len = sizeofíclientaddr); 

31 connEd = Accept(listenfd, (SA *J&clientaddr, &clientlen]; 
32 doitíconnfd); 

33 Closetíconntd):; 

34 ) 

35 } 


1228 Tiny Web 服务 器 
doit Ж 


code/netp/tiny/tiny. с 


图 12.29 中 的 doit ARAE 个 HTTP 事务 。 首 先 ， 我 们 读 和 解析 请 求 行 GE 11-12 行 )。 注 


K. RERE 11.7 中 的 rio readlineb ЖӨЖ ЕН. 





code/netp/tiny/tinv,c 


1 void doit(int fd) 

2 { 

3 int is static: 

4 strucL stat sbu:; 

5 char buf[MAXLINE], method MAXLINE], uri[MAXLINE], ve=sion[MAXLINE]; 
Б char filename[MAXLINE], cgiargs[MAXLINE]; 

7 tio t rio; 

8 

3 /* Read request line and headers */ 

10 Rio, readinitbí&rio, Ға); 

11 Rio readlineb(krio, buf, MAXLINE); 

12 sscanfíbui, "€s $s $s", method, uri, version); 
13 it (strcasecmpímethod, "GET")) í 


14 clienterror(fd, method, "501", "Not Implemented", 


оосо явная ________»жш 


15 "Tiny does пос implement this method"]; 
16 return; 
17 | 
18 read .regquesthdrasigkrio); 
18 
20 Ж Parse URI from GET request */ 
21 is Stat-c - parse uri(uri, filename, cgiargs;; 
22 ii tistatífilename, &sbuf) < 0) | 
23 clienterrorifd, filename, "404", "Not found", 
24 "Tiny couldn’ t Find this file"); 
25 return; 
26 } 
әу 
28 Е í1s static) { A" Serye static content */ 
23 if i!(8 ISsEGisbuf.st модер) i| 'iS IRUSR & sbuf,st mode)) 1 
EN clienterror(f3, filename, "403", "Forbidden", 
31 "Tiny couldn t read the file"); 
i2 return: 
33 } 
33 serve statici(fd, filename, 3buf ,st size); 
35 } 
36 else { / Serve dynamic content */ 
37 it ('[S ISREG(sbuf.st mode)) |i r(5S IXUSR & sbuz.st mode): í 
18 с1іепіеггог{ Ёс, filename, "402", "Forbidden", 
39 "Tiny couldn t run the CGI program"); 
40 return; 
a } 
2 serve dynamic(fd, filename, cgiargs); 
43 } 
44 | 





code/netp/tiny/tiny.c 
图 12.29 Tiny doit: 处 理 一 个 HTTP 事务 


Tiny 只 文 持 GET 方法。 如果 客 户 端 请 求 其 他 方法 〈 比 如 POST)， 我 们 发 送 给 它 一 个 错误 信息 ， 
并 返回 到 主 程 序 (第 13—17 行 )， 主 程序 随后 关闭 连接 并 等 待 下 一 个 连接 请 求 。 否则 ， 我 们 读 并 且 
( 像 我 们 将 要 看 到 的 那样 ) 忽略 任何 请 求 报头 {第 18 行 )。 

Ал, RIE URI 解析 为 一 个 交 件 名 和 一 个 可 能 为 字 的 CGI 参数 串 ， 并 且 我 们 设置 一 个 标志 ， 
表明 请 求 的 是 静态 内 容 还 是 动态 内 容 《〈 第 21 行 )。 如 果 文 件 在 磁盘 上 不 存在 ， 我 们 立即 发 送 一 个 错 
误 信 息 给 客 卢 端 ， 并 返回 〔 第 22—26 47). 

最 后 ， 恕 果 请 求 的 是 静 大 内容， 我 们 就 核实 该 文件 是 一 个 普通 文件 ， 而 我 们 是 有 读 权 限 的 【第 
29 行 )。 如 果 是 这 样 ， 我 们 就 向 客 刀 端 提供 静态 内 容 。 相 似 地 ， 如 果 请 求 的 是 动态 内 容 ， 我 们 就 核 
实 访 文件 是 可 执行 文件 【第 32 行 )， 如 果 是 这 样 ， 我 们 就 悉 续 ， 并 有 提供 动态 内 容 〔〈 第 42 行 )。 

clienterror Hif 

Tiny  2-ЗМДЕН ltr E ДЖ. Mul, cete euius, HET 
ЕР. 图 12.30 中 的 clienterror 函数 发 送 — HTTP 响应 到 客户 端 , 在 响应 行 中 包含 相应 的 状 
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code/neip/tinytiny.c 


l vold clientcrroríiint fd, char *cause, char *errnum, 

2 char *srortnsg, char *longmsg) 

3 1 

4 char buf [MAXI TNZE], body [MAXBUF] ; 

5 

6 /* Build the HTTP response body */ 

j sprintf {роду, "«html»«title»Tiny Errzor«/title»s"]; 

a8 aprintfibody, "*s«body bgqcolorz""ffzfff""sXirin", body): 
9 sprinLfibody, "%5%в: Ж%з\г\п", body, errnum, shortmsqgl: 
10 sprintfí(body, “За<р>%в: €s'rin", body, longmsg, cause); 
11 sprintfíbody, "%s=<=hr><em>z>The Tiny Web sẹervere/em>\rn", body); 
12 

13 /* Print the HTTP response */ 

14 sprintfibuf, "HITP/l.0 $s $sirin", ërrnum, shortnsq!; 
L5 Rio writeníifd, buf, strleni(but]!; 

16 SprinLE(bu£, "Content-type: text/htmiskrin"]; 

1; Rio writen(f£d, buf, strleníibuf); 

18 sprintf (Воі, "Content-length: £drinsrin", stzlenibody) т; 
13 Біс writenífd, buf, strleníbut£tl); 

2i] Rio writen(fd, body, strlen(bodyv)): 

2l | 


code/netp/tinyf/tiny.c 
图 12.30 Tiny clienterror: 向 客户 端 发 送 一 个 出 错 消 息 
回想 — P. HTML MBEYA EATA RA ARR. E, RENERE HTML 内 容 为 
一 个 字 罕 帅 《 第 7 一 11 10. 这 样 来 我 们 可 以 简单 地 确定 它 的 大 小 ORB 18 1). 还 有 ， 请 注意 我 们 
为 所 有 的 输出 使 用 的 都 屁 图 11.3 中 健壮 的 rio_writen AR. 
read requesthdrs M Si 
Tiny 不 使 用 请 来 报头 中 的 任何 信息 .和 它 仅 仅 调 记 图 12.31 中 的 read. requesthdrs РЁ OK ix 320 
略 这 些 报头 。 注意 , 终止 请 求 报头 的 室 文 本 行 是 由 回 车 和 换行 符 对 组 成 的 ， 我们 在 第 6 行 中 检查 它 ， 


code/netp/tiny/fin v.c 





1 vold read requcsthúrs[(rio_ t *rp) 

2 { 

3 char muI|MAXLINZE;!; 

4 

5 Ria, readlinebirp, buf, MAXLINE); 

b while(strcmp(buf, "Ssr*in")| 

7 Rio reaclineb(rp, buf, MAXLINE); 
В return; 

3 } 





code/netp/tiny/tinv.c 


12.31 Tinyread requesthars: 读 取 并 忽略 请 求 报头 


parse uri MK 
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Tiny БРАНЕ Нее ж, ШАЙНАП ЖЕНА: Не /cgi-bin, 任何 包谷 学 
FT cgi-bin HJ URI $54 A ЖА ДЕА STAR ЖЕНЕ. ВАТА АА v E dE home.html. 

图 12.32 中 的 parse uri 函数 实现 了 这 些 策 略 。 它 将 UR 解析 为 一 个 交 忻 名 和 一 个 可 选 的 CGI 
参数 失 。 如 果 请 求 的 是 静态 内 容 ‘第 5 行 ), 我 们 将 请 除 CGI 参数 串 《 第 人行 )， 然 后 将 URI 转换 为 
一 个 相对 的 Unix 路 径 名 ， 例 如 ,jindex.html (第 7 一 8 行 )。 WE URI 是 用 “7” 结 尾 的 【第 9 行 )， 我 
们 将 把 默认 的 文件 各 如 在 后 面 【 第 10 行 )。 另 一 方面 ， 如 果 清 求 的 是 动态 内 容 《 第 13 (т>, ЕЙ 
会 抽取 出 所 有 的 CGI ЕШ С 14-201» 并 将 URI 剩 下 的 部 分 转换 为 一 个 相对 的 Unix. 文件 名 (第 


21--22 379, 
1 int parse uri;char *uri, char *filename, char *cgiargs) 
2 { 
3 char *ptr: 
4 
5 if (!sgtrstr(uri, "cgi-bin"]] + /* Static content */ 
Б strcopyícgiargs, ""}; 
] strcpy(filename, "."); 
B strcat(filename, uri); 
© itf (иг1[вїг1еп{мг1}-1] == '/') 
10 strcatifilerame, "home.html"); 
11 return 1; 
12 | 
13 else { /* Dynamic content */ 
14 ptr = index(uri, '2:!); 
15 if (рг) Í 
16 strcpy[lcglarags, рїг+1}; 
17 *ptr = "\0'; 
18 ) 
15 else 
an strocpyi(cgiargs, ""}; 
21 strepy (filename, ","); 
22 strcat(fllename, uri); 
23 return D; 
24 | 
2500) 





serve static PRIK 


图 12.32 Tiny parse_u 让 解析 一 个 НТТР URI 


code/netp/tiny/tiny. c 


code/netp/tiny/tiny.c 


Tiny ДЯ Дун] ЖЕҢ! P389 ds Y. HTML 文件 、 无 格式 的 文本 文 什 ， 以 及 编码 为 GIF Z: JPG 
ЖАМАН. НЕЕ Web 上 提供 的 线 大 部 分 静态 内 容 ， 
图 12.33 中 的 serve_static PCS HTTP 响应 ， 其 主体 包含 个 本 地 文件 的 内 容 。 首 先 ， 
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我 们 通过 俭 僵 交 件 名 的 后 强 米 判 斯 交 件 类型 (第? 行 ), 7E ACIER IE T RU IJ S А РС S 
12 412. Е ААВ. 


code/neip/tiny/tiny.c 


vold serve static(int fd, char *filename, int filesize] 


d 


ГА 


int srcid; 
char *srcp, filetype[MAXL-NE], БАЁ [MAXBUF ] ; 


/* Send response headers to client */ 

get filietype(filename, flletvype)l: 

sprint bué, "HTTP/1,0 200 Оқыған"); 

sprinL£tbu£, "$s5erver: Tiny Web ServerXrMn", buf): 
sprintfibuf, "tsContent-length: $dXrkn", but, filesize); 
sprintfibuf, "€sContent-Lype: €sxr*nirsn^, buf, filetype); 
Rio writen(fd, buf, strleníbuf)); 


/* Send response body to client */ 

сүсій = Openifilename, O БООНУ, 0); 

srep = Маар(0, filesize, 2ROT READ, МАР PRIVA^E, srcfd, 0); 
Closeisrcetd): 

Hio writenífd, arcp, fiiesizel; 

Munmapísrcp, filesize); 


t get filetype - derive file type from file name 
“/ 


[ 


void get filetype(char *filename, char *filetype) 


if (s-rstr(filename, ".html")) 
stropvífiletype, "text/html"); 
сізе jf istrstrífilename, ".citf")] 
strcpy(filetype, "image/gitf"); 
else if Istrstrifilename, ",j)pg")) 
stropv[filetype, "image/jpeg"!: 
else 
sLzcpvifiletype. "rext/plain"); 


code/netp/tiny/finy.c 


图 12.33 Tinyserve static: ЖЖ Рр 


РА, Bulb X ЕЕ АЗЕЛ ИЧИР, ЖЕЦУ ЕЖ (第 15-19 £0. XX 
BERE ЕИ Н, WEIT aM. E51 ETE T füename. ЖЖ ТЕЮШАЙ. TES 
lé 17, Unix mmap ifi ЖА Ж oc PERROS) -个 虚拟 存 桩 器 空间 。 加 想 我 们 在 第 10.8 节 中 对 mmap 
的 过 论 ， 调 用 mmap 将 文件 srcfd 的 前 filesize 个 字 节 映射 到 -- 个 从 地 址 жер 开始 的 私有 只 读 虚 拟 存 
情 器 区 域 。 
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一 旦 我 们 将 文件 映射 至 存储 器 ， 我 们 就 不 再 逢 要 它 的 描述 符 了 ， 记 以 我 们 关闭 文 件 (第 17 47). 
执行 这 项 任 沉 失 败 将 叶 至 一 种 潜 企 的 任命 的 存储 器 泄 汤 。 第 18 行 执行 的 是 到 客户 颗 的 实 隐 文件 传 
Ж. rio_writen ЖЕЛ M, шер МЕНЕН) filesize 个 字 节 《它们 当然 已 经 被 喘 射 到 了 所 请 求 的 交 忻 》 
到 客户 端的 已 连接 描述 符 。 最 后 ， 第 19 行 释放 了 里 射 的 虚 氢 存储器 区 域 。 这 对 于 避免 一 个 潜在 的 至 
S I EFE ЕНІНІҢ ЛЕН. E ЧЕ) „ 

serve dynamic E 

Tiny 通过 派生 一 个 子 进程 并 在 子 进 程 的 上 下 交 中 运行 一 个 CGI 程序 , 来 提供 各 种 类 型 的 动态 内 
Ж. 

图 12,34 中 的 serve. dynamic РАЖ — А И AS ARRANA OR 677 41), 
同时 还 包括 带 有 信息 的 Server Jk. (87-917). CGI 程序 负责 发 送 响应 的 剩余 部 分 。 注 意 ， 这 并 
不 像 我 们 可 能 布 望 的 那样 健 村 ， 因 为 它 没 有 考虑 到 CGI 程序 可 能 会 遇 到 某 些 钳 误 的 可 能 性 。 


code/netp/tiny/tins.c 


1 Void serve dynamicí(int fd, char *fiiename, char "'cgiargeg] 

2 i 

3 char but !MAXL1NE], *emptylisti) = [ NULL ); 

4 

5 /* Return first part of HTTP response */ 

© sprintfibuf, "HTTP/1.0 200 ОК\г\п"); 

f Rio writenifd, bul, strleníbuf]); 

a sprintfibuf, "Server: Tiny Web Serverir in"); 

9 Rio writenifd, buf, strlenibut)!; 

10 

11 if í(Fork[) == 0) í /* child */ 

12 /* Real server would set all CGI vars here */ 

13 sertenv("QUERY, STRING", cgiargs, 1); 

14 Dup? (fd, £TDOUT FILENO); /* Redirect stdout to client */ 
15 Execve[filename, emptylist, environ); /* Run COI program */ 
15 | 

17 Wait (NULL); /#* Parent waits for and reaps child */ 

l8 |1 


— — ——— = — —- code/Detyp/Hiny/tiny.c 
图 1234 Tinyserve Әупетіс: 为 客户 端 提 供 动态 内 容 

在 发 送 了 响应 的 第 - -部 分 后 ， 我 们 会 派生 - :个 新 的 子 进 各 “第 11 行 》、 了 进 称 用 来 自 请 求 URI 
的 СОТ EAU QUERY STRING 环境 变量 ‘第 1317). 注意 ，- -个 真正 的 服务 器 将 还 要 在 此 处 
WERL CG 环境 变量 。 为 了 简短 ， 我 们 省 略 了 这 - - 步 。 还 有 ， 我 们 注意 到 Solaris 系统 使 用 的 
是 putenv Ж, ILAVE setenv ER 

接 下 来 ， 子 进程 重 定 癌 它 的 标准 输出 到 已 连接 文件 描述 符 《〈 第 14 行 )， 然 后 加 载 并 运行 СОП 
FF CB 1547). BD CGI 程序 运行 在 子 进程 的 上 下 文中 ， 它 能 够 访问 去 调用 execve 因数 之 前 就 存 
在 的 桩 同 的 打开 文件 和 环境 变量 。 因 此 ，CGI 程序 写 到 标准 输出 上 的 任 何 东 西 静 将 上身 接送 到 客户 庙 
Шен, PRALEA АДЕ ҒҰР. 

其 间 ， 父 进程 阻塞 在 对 жай 的 调用 中 ， 等 待 当 了 了 进程 终 小 的 时 候 ， 回 收 操作 系统 分 配给 予 进程 
МЕ CHR 1747). 
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尽管 一 个 Web 服务 器 的 基本 功能 非常 简单 ,但 是 我 们 不 想 纵 健一 个 稻 义 ， 以 为 篇 加 一 个 实 除 的 
Web 服 务 匡 是 非常 简章 的 ,构造 一 个 运行 很 长 时 间 丙 不 崩 渍 的 健壮 岁 Web 服 务 器 是 一 忻 因 中 的 尾 务 ， 
出 越 在 这 里 我 们 已 经 学 习 了 的 内 容 , TEY Unix PAREI- AEREANGA. 0130, pE 
小 服务 器 号 一 个 已 经 被 客户 端 关 闭 了 的 连接 ( 比如 说 ， 因 为 你 在 你 的 浏览 医 上 草 击 了 “Stop” 按钮 )， 
那么 第 一 次 这 样 的 写 会 正常 返回 ， 但 是 第 二 次 写 舟 会 引起 发 送 SEGPIPE 信号， 这 个 信号 的 默认 行为 
就 是 终止 这 小 进程 。 如 楷 捕 菊 或 者 起 略 SIGPIPE 信号， 那么 第 二 次 写 操 作 会 返回 慎 -t， 并 将 ermo 
设置 为 BPFPE。strerr 和 репог KA EPIPE 错 议 报告 为 “Broken pipe", 3E —4- 3E T 4&$ 83 
生 的 不 家 直观 的 悦 息 .总 地 来 说 ， 一 外 健壮 的 腹 务 器 必须 捕获 这 些 SIGPIPE kt, ЖНЖ wite 
E408 $3 EPIPE 错误 。 


12.7 小结 


每 个 网 络 应 丰 都 是 基于 客户 端 - 服 务 器 模型 的 。 根据 这 个 模型 , 一 个 应 用 是 由 - -个 服务 器 和 -个 
或 多 个 客 己 中 组 成 的 。 服 务 器 党 理 资源 ， 以 某 种 方式 操作 资源 ， 为 它 的 客 岂 端 提 供 服务 。 客 户 端 - 
服务 器 模型 中 的 某 本 操作 是 客户 端 -服务 器 事务 ， 它 是 由 客户 端 请 求 和 跟随 的 服务 器 响应 给 成 的 。 

务 户 靖 和 服务 器 通 过 因特网 这 个 全 球 网 络 来 通信 。 从 一 个 程序 员 的 观 所 来 看 ， 我 们 可 以 把 因 特 
网 看 成 是 一 个 全 未 范围 的 主机 集合 , 具有 以 下 儿 个 属性 ; 每 个 因特网 都 有 一 个 惟一 的 32 位 名 字 , Ж 
为 它 的 IP 地址: IP 地 址 的 集合 映射 为 一 个 因特网 域名 的 集合 ， 不 同 因 特 网 主机 上 的 进程 能 够 道 过 
连接 互相 通信 。 

客户 端 和 服务 器 通过 使 用 优 接 字 接 口 建立 连接 。 赛 接 字 是 连接 的 端点 ， 对 应 用 程序 来 说 ， 连 接 
是 以 文件 描述 符 的 形式 出 现 购 。 合 接 字 接口 提供 了 打开 和 关闭 套 接 宇 措 述 符 的 函数 ， 客 户 端 和 服务 
ФЕН ЕН АН ТЕ РН НЕ GR f 

Web 服务 器 使 用 HTTP 协议 和 它们 的 客户 端 〈 例 如 说 览 器 ) 和 后 此 通信 。 浏 览 器 向 服务 器 请 求 静 
态 或 者 动态 的 内 容 .对 静态 内 容 的 请 求 是 通过 从 服务 器 磁盘 到 得 文件 并 把 它 返 回答 客户 端 来 服务 的 。 
对 动态 内 容 的 请 求 是 通过 去 服务 器 上 一 个 子 进程 的 上 下 文中 运行 一 个 程序 并 将 它 的 输出 返回 给 客户 
请 来 服务 的 。CGI 标准 提供 了 -组 规则 ， 来 管理 客户 端 如 何 将 程序 参数 传递 给 服务 器 ， 最 务 器 如 何 
将 这 些 参 数 以 及 其 他 信息 传递 给 子 进程 ， 以 及 子 进程 如 何 将 它 的 输出 发 送 回 客户 端 。 

全 几 几 百 行 C 代 公 就 能 实现 -个 简单 但 是 有 功效 的 Web 服务 器 , 它 既 可 以 提供 静态 内 容 , 也 可 
ЭЗЕ Р. 


参考 文献 说 明 

馈 广 的 有 关 因 特 网 的 信息 源 被 保存 在 一 系列 的 可 免费 获取 的 带 编号 的 交 档 RFE [ Requests. for 
Comments， 请 求 注解 ，Intermet 标准 (草案 }] 中 。 在 以 下 网 站 可 获得 可 搜索 的 RFC 的 索引 ， 

http://www.rfc-editor.org/rEc.html 

RFC 通常 是 为 因特网 基础 设施 的 开发 者 编写 的 ， 因 此 ， 对 于 普通 读 首 来 说 ， 往 往 过 于 详细 了 。 
П, ТЕМЕ А, АЕ ИЕ Г. НТТР. 协议 记录 在 ВЕС 2616 P. MIME 类 者 的 
权威 列表 保存 在 : 
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ftpi//ftp.i1g1.edu/in-nctes/lana/assignmente/media-types/media-types 

关于 计算 机 网 铬 互联 有 大 量 好 的 文献 [和 村，58，84]。 伟 大 的 技术 作家 W. Richard Stevens 编写 了 
一 系列 关于 诸如 高 级 Unix 编程 [76]、 因 特 网 协议 [77，?38，791， 以 及 Unix ЯҒ 81, 8012 it 
题 的 经 与 文献 。 认真 学 习 Unix 系统 编程 的 学 生 会 配 要 研 客 所 有 这 些 内容 。 不 位 的 是 ,Stevyens ТЕ 1999 
тон. 我 们 会 永远 纪念 他 的 页 献 。 


ЖЕТЕМ 

125 ФФ 

А. Ё Tiny {ЙЧ АРК ДАН]  УАЖАТЛ BEER TRE 

B. ЯНА Ы сін Tiny 发 送 一 个 对 静态 内 容 的 请 求 ,把 Tiny 的 输出 记录 到 - -个 文件 巾 。 

C. 检查 Tiny 的 输出 ， 确 定 你 的 浏览 器 使 用 的 HTTP 的 版 本 。 

D. 参考 RFC2616 中 的 HTTP/1.1 标准 ， 了 确定 你 的 浏览 器 的 HTTP 请 求 中 每 个 报头 的 会 义 。 你 可 
以 从 www.rfc-editor.org/rfc.html 获得 КЕС 2616. 

127 ФФ 

扩展 Tiny， 使 得 它 可 以 提供 MPG ЙЛЫ. A-AA ERA A ЕЖЕ de RN ETE: 

128 %Ф% 

Жүй Tiny, ТЕН SIGCHLD 处 理 程序 中 回收 操作 系统 分 内 给 СОТ 了 进程 的 资源 ， 而 不 是 显 
AUS GEEHRTE 

129 %Ф% 

{ЁТ Tiny. ЕЛЕНА YEN]. H malloc. rio readn #lrio_writen, fj 4^ È mmap KI 
rio writen, ЖР DL stie sk oc (ES ce SL. 

1210 €€ 

A. 巨 出 图 12.26 中 CGI adder ic^] HTML EE., {ЕЕ АКУ ЕНЕ ИЖЕ. ds 
相 期 的 两 个 数字 赴 在 这 个 两 个 文本 框 中 ， 你 的 表单 度 该 使 用 GET 方法 请 求 内 容 ， 

B. 目 这 样 的 方法 来 检查 你 的 程序 ， 使 用 一 个 真 下 的 浏览 器 向 Tiny 清 求 表单 ， 向 Tiny 提交 填写 
GEAR. MU tis adder 生成 的 动态 内 容 ， 

1211 %% 

扩展 Tiny， 忆 支持 HTTP HEAD 方法 。 使 用 TELNET 作为 Web 窗户 端 来 验证 你 的 工作 。 

12.12 €€9 

扩展 Tiny， 使 得 它 服 务 以 НТТР POST 方式 请 求 的 动态 内 容 。 使 用 你 喜欢 的 Web Si ЗЕ de ur 
你 的 工作 ， 

12.13 %%% 

修改 Tiy, PRESU FARE (PREIL) 在 write 函数 试图 气 -- 个 过 早 关闭 的 连接 时 
ЖЕН SIGPIPE 信号 和 EPIPE 错误 。 
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Ek >] EN 3 
AJE 12.1 答案 


255,255.255.255 


— 


127.5.0.1 


pru 


——— — - 


бхіТЕТІТІЕ | 
ÜxTEDQQQQS 


axcdbcab ?" 205.188.160.121 


uz400c350q ба.„4.1%3.1 


(xcdhbc321l7 Z55.186.146.23 








练习 题 12.2 答案 
code/netp/hex2dd.c 
1 #include "csapp.h" 
2 
3 int mairí(int ағас, char **argv) 
4 { 
5 struct in_addr inaddr; /* addr in network byte order */ 
Б unsignec int адат; ғ addr in host byte order */ 
т 
B if [агас !- 2) Í 
3 tfprintf(stderr, "usage: Жа «hex number-in", argv[0]): 
10 ехіші0); 
11 ) 
12 sscanilargv[1], "х", &addr); 
H inaddr.s addr = htonlíaddr); 
14 prinzfí"&sn", inet, ntoa(inaddr)); 
15 
16 exibtü); 
17 ] 
code/netp/hex2dd.c 
ЖЫН 12.3 答案 
code/netp/dd2 hex.c 
1 #include "счарр.п" 
2 
3 int mainíint атас, char “%агау) 
4 [ 
5 struct in addr inaddr; /* addr in network byte order */ 
6 unsigned int addr; Ғғ addr in host byte order */ 
7 
Я if (ағас != 2) ( 
9 tpriatfístderr, "usage: $s <dottec-decimals‘\n", argv[0]); 
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10 exit (0); 
11 | 
12 
13 if (inet atoní(argv[1], &inaddr? == 0) 
14 app errorí"'inet aton error"); 
15 addr = ntohliinad3r.s_addr); 
15 printfí('OÜx£&xir", addr); 
17 
18 екігіді; 
19 
code/netp/ddZhex.c 
о) 12.4 ЖЖ 
每 次 我 们 请 米 aol.com 的 主机 条 目 时 , 相应 的 因特网 地 址 列表 以 一 种 不 则 的 \ $887 Cround-robin? 
t1 F3 a 
unix» ./hostinfo aol.com 


official hostname: aol.com 
address: 205.188.145.23 
address: 205.188.160.121 
address: 64.12.149.13 


ппік>> ./hostinfo aol.com 
official hostname: aol.com 
address: 64.12.149.13 
address: 205.188.146,23 
address: 205.188.160.12- 


unix»- ./hostinfo aol, com 
official hostname: aol.com 
address: 205.188,146.23 
address: 205,.,188.160.12- 
address: 64.12.149.13 


在 不 同 DNS 查询 中 ， 退 回 地 址 的 不 同 顺 序 称 为 DNS 轮转 (DNS round-rebin)， 它 可 以 用 来 对 
一 个 大 量 使 用 的 域名 的 请 求 做 负载 平衡 ， 
练习 题 12.5 答案 


标准 UO 能 在 CGI 程序 里 上 作 的 原因 是 , 在 了 进程 中 运行 的 CGI 程序 不 需要 显 式 地 关闭 它 的 输 
入 输出 流 ， 当 了 于 进 称 终 止 时 ， 内 核 会 自动 关 财 所 有 描述 符 。 
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正如 我 们 在 第 8 章 学 到 的 , an omi pes occ Е es 那么 它们 就 是 并 发 Cconcurrent) H). 
这 种 一 能 坝 象 ， 称 为 并 发 性 (ceoneureney)， 出 现在 计算 机 系统 的 广 多 本 同 层 面 中 。 和 而 件 主 利 处 理 行 
序 、 进 程 和 Unix 信号 处 埋 程 序 部 是 大 家 很 熟悉 的 例 了。 


划 


日 前 为 止 ， 我 们 主要 将 并 发 性 在 做 旦 一 种 内 核 用 米 运 行 多 个 应 用 程序 的 策略 ， 但 是 ， 并 发 性 


不 仅 促 局 限于 内 核 , 筷 也 可 以 在 应 用 程序 中 扮演 重要 角色 。 例 如， 我 们 已 经 看 到 Unix 信号 处 理 程序 
如 何 允 许 度 用 响应 异步 事件 ， 例 如 用 户 键入 ctrl-c, RAER НИТТЕ 85 memory) 的 一 个 林 
EARKI. У НАЛАТ АНТЕ P UE IR: 


d$ = LHE, ERA- СРО ЖАКЕ К, ЖАНЫМ. ТЕШЕ] 
间 点 上， 都 内 有 ”个 流 在 CPU 上 实际 执行 ， 然 而 ， 那 些 有 多 个 CPU 的 机 器 ， 称 为 多 处 理 
Z. THA EBART T. 被 分 成 并 发 流 的 并 行 上 应 用 ， 在 这 笠 的 机 器 上 上 能够 运行 得 
快 很 者。 这 于 太 规 模 数 据 库 和 科学 应 用 论 为 时 要。 

Ж РИ МО 设备 。 当 一 个 应 用 正在 等 待 来 月 慢 速 TO 设备 Col ERO. ARENAN, A 
支 会 运行 其 他 进程 ， 使 CPU RERI., EAEE AAMA MAT ГО 
ЖИЫНЫНА, KEHRT. 

SARZE. ЖУН АА ЗУБА ЕВЕ 27. ИШ. EAT EL 
个 文档 时 ， 可 能 想 归 调整 一 个 窗口 的 大 小 。 现 代 视 实 系 绕 利 用 并 发 性 来 握 供 这 种 能 万 。 每 
次 用 户 请 求 菜 种 樟 作 【比如 说 通过 单 击 鼠 标 》 时 ， 一 个 独立 的 并 发 逻辑 流 被 创建 来 执行 这 
"BRE. 

iB НА ТРУДО ЛТ]. Ti]. Bv HFE PF BE EAS L ЫН Rb ka Н ERIT E HT. 

ЖНЖ АЕ ep ЕВ ШОВ. Б. -ЖЫ ТЕАТ АЙ ME R ЕДІ 
在 较 低 优先 级 上 的 并 发 “合并 * 流 的 合 半 (coalescing )， 使 用 空 采 时 的 CPU 周期 ， 来 降低 
单个 free 操作 的 延迟 。 

服务 多 个 网 络 客户 端 。 我 们 在 第 12 章 中 学 习 的 壕 代 ‘iterative) 网 络 服 务 器 是 不 现实 的 ， 因 
为 它们 一 次 只 能 为 -个 客户 疡 提供 上 服务 。 因 此 ， 一 个 慢 巡 的 客户 症 可 能 会 导 狼 服务 器 拒绝 
为 所 有 其 他 客 慷 疡 服务 ， 对 于 一 个 真正 的 服务 器 来 说， 吕 能 期 望 它 每 种 为 成 百 上 千 的 窗户 
mH. Ме ZR Po SEED AB ELE T3 RR. ӘХ ETAR E. ARE 
AGERSIE—TOGUAGR NER. КАТЕР ШЕ ОНОЙ ЛИРИ. ХАЛІНЕН 
HALTAN WRA. ЛАН T BER Р н ES S. 


T Fr] Sz FE ZR E PL RYE FRE ЛАҒАН (concurrent Program)。 了 现代 操作 系统 提供 了 一 种 基本 
IER XE JT ЖЕНЕ: 


d. Hx Л, FARR В — ЗЕН, ШАН KB S PE. AA HEET Ak 
LIB КЕЛУДЕН ЕР Н), ЖЖЖ RO tb ОШ fu. БЫЛ DON 4# H] EORR mos RS gat 48 Up ñ 42 
(interprocess communication, IPC? 机 制 。 

UO 多 路 复 用 。 在 这 种 形式 的 并 发 编程 中 ， 应 用 程序 在 一 个 进程 的 上 下 文中 显 式 地 调度 它 
全 己 的 逻辑 流 。 过 辑 流 被 模 模 化 为 状态 术 ， 作 为 数据 到 达 交 性 描 述 符 的 结 开 ， 证 程序 显 
式 地 从 一 个 状态 转换 到 男 一 个 状态 。 达 为 程序 是 -个 单独 的 进程 ， 所 以 所 有 的 流 都 共享 癌 
一 个 地 址 空间 。 

线程 。 线 程 是 运行 在 -个 单一 进程 上 下 文中 的 逻辑 流 ， 由 内 核 进行 调度 。 你 是 以 把 线程 看 
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КЕНЕ h R А, EHEH HE HH INT UNITE. ПЕ ПО 多 路 复 用 流 一 梓 共 
33 [i] — ^^ ИДИШ. = |8]. 
本 章 研 究 这 二 种 不 同 的 并 发 编程 技术 。 为 了 使 我 们 的 讨论 比较 具体 ， 我 们 始终 以 同一 个 应 用 为 
例 一 一 12.4.9 Tp S (X echo RE 538 IAEA. 


13.1 基于 进程 的 并 发 编程 


构造 并 发 程序 最 简单 的 方法 就 是 用 进程 , 使 用 那些 大家 都 很 熟悉 的 图 数 , 像 fork.exec ЖІ waitpid. 
HA c -个 构造 并 龙 服 委 器 的 日 然 方法 就 是 ， 在 父 进程 中 接受 客户 疹 连 接 请 求 ， 然 后 世 建 一 个 新 的 
БЕН ХЕ ГЕРА AS. 

ArT fb kan CAEBS. БИТВ РА АУ Р 1 ЗА, RR SERIE E nr e WS r HE 
述 符 《比如 说 是 D 上 的 连接 请 求 。 现 在 假设 服务 器 接受 了 客户 端 1 的 连接 请 求 ， 并 返回 - -个 已 连 
接 描述 符 《 比 如 说 是 4)， 如 图 13.1 PTK. 


a 


clientfd Те, listenfdi3) 


т 


cennf3dí4) 
EPH? 


clientfd 
13.1 第 一 步 : 服务 器 接 爱 客户 端的 连接 请 求 
在 接受 连接 请 求 之 后 ， 服 务 器 派生 一 个 子 进 程 ， 这 个 了 进程 获得 服务 器 描述 符 表 的 完整 拷贝， 
于 进程 关闭 它 的 监听 的 述 符 3, 而 父 进 程 关闭 它 的 已 连接 描述 符 4, 因为 不 青 需 要 这 些 描 述 符 了 。 这 
就 得 到 了 图 13.2 中 的 状态 ， 其 中 子 进 程 正信 于 为 客户 端 提供 服务 。 






数据 传送 


сопп?Ё@ {4 ] 


listenfd|1) 


clientfd 


[es 


ciientfd 


|3.2 第 二 步 : 服务 器 派生 一 个 子 进程 为 客户 端 服务 


因为 父 、 子 进程 中 的 已 连接 描述 符 都 指向 同一 个 文 性 表 表 项 ， 所 以 父 进 程 关 闭 它 的 已 连接 接 述 
从 十 至 大 重要 的 。 否 则 ， 将 永 不 会 释放 已 连接 描述 符 4 的 文件 表 条 目 ， WH kale ni r i RIEN 
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КЕЗІНЕН НИТ гін), HERRE. 
HM r, БОЕН Т Е ГРН ја, ЕКЕІ-ТИКЕРІп2 的 连接 请 求 ， 
并 返回 一 个 新 的 已 连接 描述 符 《比如 说 是 5)， 如 图 13.3 所 示 。 





cnnntd 'd) 


“ІлепіҒЯ ilstentd:sl 
^ 
Е 
| v стим (53 
«ын | ERR 
elientfà 


13.3 第 三 步 : 服务 路 接受 另 一 个 连接 请 求 


然后 ， 父 进程 义 派 生 一 个 子 进程 ， 使 子 进程 用 已 连接 描述 符 5 ACHA- МАЛЫ. ШЕ 
13.4 所 示 ， 此 时 ， 父 进程 正在 等 待 下 个 连接 请 求 ， 而 两 个 子 进 程 正在 同时 为 他 们 各 有 门 的 客户 闹 提 


ВЕ. 
子 进程 1 
соппїа (4) 


clientf3 ligtenfdüi[3) 





conntdís! 


13.4 #4: ЕЕЕ ИЕЛЕН 5 


13.1.1 基于 进程 的 并 发 服务 器 
ASERT- :个 基于 进程 的 并 发 echo НД, 


code/conc/echoserverp.c 
#inc ude "csapp.h" 
vöid есћо(1лі connfd); 


void sigchld handler(int sig) 
{ 
while (waitpidí-1, 0, WNOHANG) > 0) 


GO ~] C^ іл e м ығы 


return; 
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9 | 
10 
12 int mainí(int ағас, char **argv| 
12 Í 
13 int listenfd, connfd, port, clientlen-sizeofí(struct sockaddr, in); 
14 struct sockaddr in clientaddr; 
15 
16 if (ағас 1= 2] | 
17 fprintfí(stderr, "usage: %s «port»n', argv[0]); 
18 exitio); 
19 ) 
20 port = абої{агду[1]}; 
21 
22 Signal[(STGCHLD, sigchid_handler) ; 
PK listenzd = Open listenfdí(port); 
24 while (1) í 
25 connfd = Acceptilistenfd, (SA *) &clientaddr, &clientlen); 
25 it (Fork[) == Ü) 1 
7 Closeilistentfd):; /* Child closes its listemng socket */ 
28 есһо(соппїа}; /* Child services client */ 
29 Closeiconntd);  /*Childcloses connection with client */ 
30 exitio; + Child exits */ 
31 } 
32 Closei(conntfd); /* Parent closes connected socket (important!) */ 
33 } 
34 1 


code/conc/echoserverp.c 


E135 ”基于 进程 的 并 发 echo 服务 器 
ОН (өе) КРИ ЕРІНІН Ж. 


Ж 28 行 调 用 的 echo MAKATA 12.21. X FARA. Ж Л, ЖЖ ОЖ ЖЛЕ: 

。 首先 ， EN RAS RBS. МАЯ meti SIGCHLD 处 理 程序 ， 来 回 
W isk zombie) TIRRENI EUR COS 4-9 530. КАЗ SIGCHLD Ф A Thi, SIGCHLD 
信号 有 是 阻塞 的 ， 而 Unix fa R: ASHEEA fJ, AE SIGCHLD НЕН A d # + 8 
死 了 进程 的 资源 ， 

+ 上 其 次 ， 父 子 进 程 必 须 关 闭 它 们 各 自 的 confid 《分 别 为 第 32 行 和 第 29 行 ) 3€ DL. ӘӨИ 
已 经 提 刘 过 的 ， 这 对 父 进程 而 言 尤为 重要 ， 它 必须 关闭 它 的 已 连接 描述 符 ， 以 避免 存 撒 器 
ЖЕЛЕ. 

. Xn. [МЕТИЛ АИ ЈА АУУ НИ, АУ ЕЕ connfd 部 关闭 了 了， 到 客户 
小 的 连接 才 会 终 趟 。 


13.1.2 X Tut 
对 于 在 父 、 子 进程 间 共 享 状态 信息 ， 进 程 有 一 个 非常 清晰 的 模型 ， 共 享 文件 表 ， 但 是 不 共享 用 
户 地 址 空间 。 有 独立 的 进程 地 址 空间 既是 优点 ， 也 是 缺点 。 这 样 -来 ， 个 进程 不 可 能 不 小 心 各 羡 
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男 一 个 进程 的 虚 氟 存储器， 这 就 消除 了 许多 令 人 人 迷惑 的 错误 一 一 这 是 一 个 明显 的 优点 ， 

力 一 方 徊 ， 独 并 的 地 址 空间 使 得 进程 共享 状态 信息 变 得 更 加 困难 。 为 了 共享 信息 ， 它 们 必 痪 使 
НІ ДМ IPC 《进程 间 通 信 ) 机 制 。 基 寺 进 程 的 设计 的 另 一 个 缺点 是 ， 它 们 往往 比较 慢 ， 因 为 进程 
控制 和 IPC 的 开销 很 高 ， 


S. Unix IPC 

在 本 书 中 ,你 已 经 通 到 好 几 沾 IPC 的 例子 了 ,第 8 章 中 的 waitpid RAF Unix £83 Ж Xj IPC 
机 制 ， 它 们 充 许 进程 发送 小 消息 到 同一 主机 上 的 其 他 进程 ， 第 42 章 的 亦 接 字 是 IPC 的 一 种 重要 形 
式 ， 富 元 许 不 同 主机 上 的 讲 程 交接 任意 的 字 节 流 。 热 而 ， 术 语 Unix IPC HE HE PCR AUREUS 
同一 对 主轴 上 其 他 话 程 进行 通 情 的 技术 ， 其 中 包括 管道 、 先 进 先 出 【HTPO)、 系 和 级 V 共享 存储 器 ， 
ААА УЕЗ, Xd AXE T SS TEE М. Stevens 的 著作 [80] 是 很 好 的 泰 者 资料 。 


练习 题 13.1 


在 图 13.5 中 ， 并 发 服务 器 的 第 32 行 上 ， 父 进程 关闭 了 已 连接 描述 符 后 ， 子 进程 仍然 能 够 使 用 
ЖЮ е 1845, ЖА? 


ЖАН 132 
УЖ ЖИЕ 13.5 中 关闭 已 连 缕 描述 符 的 第 29 p. АЛАИ Бл А ЛЕ kj, Kan 
XR LAGER. ЖА? 


13.2 + VO 多 路 复 用 的 并 发 编程 


慨 设 鉴 求 你 编号 一 个 echo 服务 器 , 它 也 能 对 用 广 从 标准 输入 键入 的 交互 命令 做 出 响应 。 在 这 种 
情况 下 ， 服 务 器 必须 响应 两 个 互相 独立 的 UO 事件 ， 网 络 客户 喘 发 起 连接 请 求 ; 用 户 在 键盘 上 键入 
节令 行 。 我 们 移 等 待 哪个 事件 呢 ? 没有 哪个 选择 是 理想 的 。 如 果 我 们 在 accept 中 等 待 个 连接 请 求 ， 
我 们 总 不 能 用 应 得 入 的 命令 。 类 似 地 ， 如 果 我 们 在 read 中 等 待 -- 个 输入 命令 ， 我 们 就 不 能 响应 任何 
iE BK. 

针对 这 种 困境 的 一 个 解决 办 法 就 是 VO $ 3&3 BL (LO multiplexing) 技术 。 基 坟 的 思路 就 是 使 
用 select 基数 ， 要 求 内 核 挂 起 进程 ， 只 有 在 一 个 或 多 个 UO 事件 发 生 后 ， 才 将 控制 返回 给 应 用 程序 ， 
x RO P ERR, -#: 

вО, АРМА ТИЕ НЫ ЈЕ [А]. 

. 当 集 全 {1，2，7} 中 任意 描述 符 准备 好 写 时 返 司 。 

. 如果 在 等 待 一 个 LO 事 咎 发 生 时 过 了 15213 秒 ， 就 超时 。 

select д. “个 复杂 的 函数 ， 有 许多 林 同 的 使 用 模式 。 我 们 将 只 讨论 第 一 种 模式 : 等 待 - -组 描述 
符 准 备 好 读 。 全 面 的 讨论 请 参考 [76，81]。 


#include «unistd.h» 
#include «<sys/types.h> 
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int selectiint n, fd set *fdset, NULL, NULL, NULL); 
ik Cop sede it eS AERE ЕЕ, GbR 5-1. 


FD, ZERO(fd set = ёсе): /* Clear all bits `n fdser */ 
FD CLR(irt fd, fd set *fdset); /* Clear bit fd in fdset */ 
Ер SET(irnt fd, fa set *fdset); /* Turn on bit fd in fdset */ 
FD.ISSET(int fd, [d se- *fdset); /* Is bit fd in fdset turned on? */ 
ALB deu MG E. 


select 丙 数 处 理 类 型 为 得 _set 的 集合 ,也 叫做 描述 符 集 合 。 轴 辑 上 ， 我 们 将 描述 符 集合 看 成 个 
大 小 为 n BT TE. 





ЖА 

每 个 位 b, АНАНЫ. SERSA Р =, ЙИ k KIM ERS ES TE. АЛ 
ИМЛЕ OEE: ЭЕТ; 将 一 个 此 种 类 型 的 变量 赋值 给 另 一 个 变量 ; 出 FD ZERO. 
FD SET. FD CLR 和 FD ISSET 宏 指 令 来 收 改 和 检查 它们 。 

针对 我 们 的 日 的 ，select CEPR LA: 一 个 称 为 读 全 合 的 描述 符 集合 〈fdset) 和 该 读 集 合 的 
元 素 量 (n), select 送 数 会 一 起 阻塞 ， 直 到 读 集合 中 双 少 有 一 个 描述 符 准 备 好 可 以 读 。 当 上 侈 当 一 
个 从 谍 挤 述 符 读 取 一 个 池 节 的 请 求 不 会 阻塞 时 , 描述 符 k 就 表示 准备 好 可 以 读 了 。 作为 一 个 副作用 ， 
select EH TER fdset Е АВЧ fd _set， 指 明 读 集合 中 -个 称 为 准备 好 集合 【ready set) ЁГ, 
集合 是 出 读 集合 中 准备 好 可 以 读 了 的 描述 符 组 成 的 。 两 数 返 回 的 值 指明 了 准备 好 集合 的 元 素 量 。 注 
意 ， 由 于 这 个 副作用 ， 我 们 必须 在 每 次 调用 select 时 都 更 新 读 集 合 。 

理解 select 的 最 好 办 法 是 研究 一 个 具体 生子。 图 13.6 展示 了 我 们 可 以 如 何 利用 select 来 实现 一 
ЛЕ echo 服务 器 ， 它 也 可 以 接受 标准 输入 上 的 用 户 命令 。 


rode/corncóselect. с 


1 #include "csapp.h" 

2 void echoíiat connid'; 

3 void command(ívoid!); 

4 

5 int mainí(int ағас, char **argw) 

5 i 

7 int listenfd, connfd, port, clientlen = sizeof {struct sockaddr іп); 
8 struct sockaddr in ciientaddr; 

9 ГО set read set, ready set; 

10 

11 ІІ іағас != 2) { 

12 tprintf(stderr, "usage: %в «port»in", argv[0]); 
13 ехісі0); 

14 } 

15 pert = аїо1 (агау [1]); 

16 listenfd = Open_listenfdiport]); 

17 


18 FD ZE3O(&read set); 
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15 *D SET(STDIN FILENO, &read seti; 

20 =D_SET(11stenfd, &read set); 

21 

2 while 11) 1 

23 ready set = read set: 

24 selecti(listenfíd«l, асеайу set, NULL, NULL, NULL): 
25 if !FD ISSET(STDIN FILENO, gready_set)) 
26 commandi): /* read command line from stdin */ 
27 if (Ер ISSZT(listenfd, &ready_set)) 1 

28 conntfd = Acceptilistenfd, [5A *)&clientaddr, &clientlen): 
29 echo(connzd); /* echo client input until EOF */ 
30 } 

31 } 

32 |} 

33 

id void commandivoid) ( 

35 char buf (MAXLINKNE]; 

36 if (!Fgetsibuf, MAXLINE, stdin)) 

37 exit {0}; /*EOF */ 

38 printf("€s", bui); /* Process the input command */ 
39 1 





code/conc/select.c 


13.6 НИО 多 路 复 用 的 echo 服务 器 
服务 器 使 用 select 等 待 监听 撒 述 符 上 的 连接 主 求 和 标准 输入 上 的 命令 ， 


一 开始 ， 我 们 用 图 127 中 的 open_listenfd 函数 打开 一 个 监听 撒 述 符 (第 16 行 )， 然 后 使 用 
FD ZERO 创建 一 个 空 的 读 焦 合 ， 
115 егп Ға ап 


4 z | 0 


мәни, ат 


WX. (Е 19 一 20 行 中 ， 我 们 定义 由 描述 符 0 (标准 输入 ) 和 描述 符 3 (监听 描述 符 ) 组 成 
P. 
listenfd ardin 


i 2 1 ü 


ERE, (ПТ ЖИЕ RMA. HERNAN accept 防 数 来 等 待 一 个 连接 请 求 ， 而 是 
Wii FH select PS, Хаж EX, ESI a Е PE АН НІ ОЖ 24 ÍT) 
ӨЗІ, EEA ат, Dl ЕН АННА АТПЕН, select 会 返回 能 ready sel 
ШИН: 
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listentd stdin 


3 2 | 9 


—H select 511], RIRH FD_ISSET 宏 指令 来 判断 哪个 描述 符 准 备 好 可 以 读 了 。 如 果 是 标准 
输入 准 各 好 了 第 25 行 )， 我 们 就 调用 command РА, ТЕА E FU. mE. ЖІПЛІҢ 
应 命令 。 如 果 是 监听 描述 符 准备 好 了 【第 27 行 )， 我 们 就 调用 accept 来 得 划一 个 已 连接 描述 符 ， 然 
后 调用 图 12.21 中 的 echo ERG 它 会 将 来 自 客户 端的 每 一 行 父 回 送 回 去 , А. ЖЖ P ИЕ НЕ. 

ККЕ ДЕН select 的 一 个 很 好 示例 ， 介 是 它 仍 然 留 下 了 一 些 问 题 竺 解决。 问题 是 一 卫 
它 连 接 到 某 个 客户 端 ， 就 会 连续 回 送 输入 行 ， 直 到 客户 端 关闭 它 的 连接 端 。 因 此 ， 如 果 你 键入 一 个 
命令 到 标准 输入 ， 你 将 不 会 得 到 响 庶 ， 直 到 服务 器 和 客户 端 之 间 结 束 。 个 更 好 的 方法 是 更 细 粒 度 
的 多 路 复 用 ， 了 服务 器 每 次 循环 至 多 ) БЕТ СПАН 13.3). 


13.2.1 基于 WO 多 路 复 用 的 并 发 事件 驱动 服务 器 

UO 老路 技术 可 以 用 懒 并 发 事件 驱动 Cevent-driven? 程序 的 基础 ， 在 事件 驱动 中 ， 流 是 作为 基 
种 事 性 的 结果 前 进 的 ,一 艇 概念 是 将 效 辑 流 模 型 化 为 状态 机 ,不 严 冤 地 说 ,- :个 状态 机 (state machine) 
斌 是 一 组 状态 (state), Жл (при event? 和 转移 《transition)， 其 中 转移 就 是 将 状态 和 输入 事 
TTA DIAC. 每 个 转移 都 将 一 对 (输入 状态 和 输入 事件 ) 瑞 射 到 一 个 输出 状态 。 自 往 环 (self-loop) 
EE- МАЯ НАҚ АКЕ. ЖЕККЕН НЫН, РПН ЛАЖ. ЫР ЖЕН 
1, ШШДЕ АШ АЗЫ. МК LA Chalan АНАНЫ. Soli aa И | — 
个 从 当前 状态 到 下 一 状态 的 转移 。 

NTS Emo: ЕТІ 多 路 复 用 的 并 发 服务 器 会 创建 一 个 新 的 状态 机 5, 并 将 它 和 已 
连接 描述 符 太 联系 起 来 ,如 图 13.7 所 示 , 每 个 状态 机 关 都 有 一 个 状态 们 等 待 描述 符 下 准备 好 可 读 妆 ， 
一 个 输入 事 忻 ШАН ds BRI ELE T UO 和 - :个 转移 “АЗИЛ d, E77 X AT». 


A EPI “Ж ЖАКУ, 
d a W n] EJ it Гг" 


状态 :“ 等 符 描 述 符 
小 准备 好 可 该 ” 


ЕЕ. “АЖАМ 
站 圭一 个 交 本 行 ” 











13.7 并 发 事件 驱动 echo 服务 器 中 逻辑 流 的 状态 机 


服务 器 使 用 ШО 多 路 复 用 ， 借 助 select 函数 ， 检 测 输入 事件 的 发 生 。 当 每 个 己 连 接 描 述 符 准备 
好 可 优 时 ， 服 务 嘴 就 为 相应 的 状态 机 执行 转移 ， 在 这 里 就 是 从 描述 符 读 和 写 回 一 个 文本 行 。 

图 13.8 展示 了 一 个 基于 VO 名 路 复 用 的 并 发 事件 驱动 服务 器 的 完整 示例 羽 码 。 活动 窒 让 端的 集 
合 维护 在 一 个 pool (b) 辣 构 里 ‘第 3 一 11 行 )。 在 通过 调用 init pool 初始 化 池 《 第 2817) 之 后 ， 
服务 器 进入 -个 于 限 循环 , 在 每 次 要 环 中 ， 限 务 器 调用 select АКЕ RIS EAEN АЗИЯ. 
来 已 一 个 新 客户 端的 连接 请 求 到 法 ;一 个 已 存在 的 客户 端的 已 连接 措 述 符 准备 好 可 以 污 了 。 当 一 个 
连 捷 请 求 到 达 时 【第 35 行 )， 服 务 器 打开 连接 【第 36 行 )， 并 调用 add client Ж, СЕЛ 
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加 到 池 里 《第 37 17), 最后， 服务 器 调用 check client АШ, ҒЕНЕФИЕНИЦЕВЕА ТІК 
一 个 文 杰 行 回 送 回去 《第 41 472. 


code/conc/echoservers.e 


#include "csapp.h" 


typedef struct { /* represents a pool of connected descriptors */ 
int maxfd; /* largest descriptor in read set */ 
fd set read set; {* set af all active descriptors */ 
fd set ready set; /* subset of descriptors ready for reading */ 
int nready; /* number of ready descriptors from select */ 
ink maxi; /* highwater index into client array */ 
int clientfd[FD SETSIZE]; /* set of active descriptors */ 
rio 2 clientrio[FD, SETSIZE]; {* set of active read buffers */ 
} pool; 


int byte cnt = 0; /*counts total bytes received by server */ 


int main(inl argc, char **argv) 


| 


inL -istenfd, connfd, port, clientlen = sizeofístruct sockaddr іп); 
struct sockadd- in clientaddr: 
static pool pool; 


if (ағас !- 2) + 
Iprintfístderr, "usage; $s «port»*n", arqv[0]); 
exitio); 

} 

port = ¿tollargvill); 


listenf&á = Эреп listenfdiport); 
init. pool(listenfd, &pool!: 
while (1) f 
]* Wat for listening/connected descriptor(s) to become ready */ 
pool.ready set - pool.read set; 
pool.nready = Select (pool.maxfd«l, &pool.ready set, NULL, NULL, NULL); 


/* [f listening descriptor ready, add new client to pool */ 

if {РО ISSET(listenfd, &pocl.ready set!) f 
cornfd = AÀcceptílistenfd, (БА *J&clientaddr, &zlientlen]; 
add clienticonnfd, &pool); 


/* Echo a text line from each ready connected descriptor */ 
check clientsi&pool!; 
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code/conc/echose rvers.c 


$138 AF10 条 路 复 用 的 并 发 echo 服务 器 
每 次 服务 器 循环 都 回 送 求 白 每 个 准备 好 的 摘 述 符 的 文本 行 ， 


inít pool ЕЖ (图 13.90 PAA A. chend sc p ERES. E-i 表示 
一 个 可 用 的 展位 。 初 冶 时 ， 已 连接 描述 符 集合 是 字 鸭 【第 5-7 行 )， 而 用 监 昕 描述 符 是 select ЖЕ 
舍 中 惟一 的 描述 符 ( 第 ]0 一 12 115. 


code/conc/echaservers.c 


1 void init poolíint listenfd, pool *р) 
2 | 

3 /* Tnitjally, there are no connected descriptors */ 
4 int 1; 

5 р->йах! = -1; 

Б for (1-0; іс FD SETSIZE; ++] 

Қ p->clientfd3(il] = -1; 

8 

9 /* Imtialiy, listenfd is only member of select read set */ 
10 р->махі = listenfd; 

11 FD ZERO[kp-»read сег); 

12 FD SET[listenfd, &kp-»read вен); 
13 | 


code/conc/echoservers.e 
图 13.9 init pool: ЯЛЕ ЖЫЛ Pim 


add chent СЕН 13.100. AAR Jl ТЈ Ж ЛЕ ӘЛ ЭН. ТЕ clientfd 数组 中 找到 -- 个 空 
BE Ж ААЛА АЛЕКЕ ЛЕНА. ЖИЕНІН Rio ЖЖ ША. TESTS 
这 个 描述 符 调用 rio readlineb CB 8—9 行 )。 然 后 , 我 们 将 这 个 已 连接 描述 符 添 圳 到 select 读 集 合 (第 
12 行 )， 首 更 新 该 凶 的 一 些 全 员 属 性 。maxfa 变量 (第 15-1647) 记录 了 select 的 最 人 文件 描述 符 ， 
maxi 变量 (17-418 行 ) 记录 的 是 clientfd 数组 的 最 大 索引 ， 这 样 check clients 函数 就 无 需 搜索 整 


个 数组 了 ， 
code/canc/echoservers.c 
1 void add с11епї{їлї connfd, pool *p) 
2 { 
3 int 1 
4 р->ггваайу--: 
5 for {1 = 0; 1 < ҒО SETSIZE; із») P Find an ауа е slot */ 
Б iL ip-»clientfd]:] < 0) 1 
7 ж Add connected descriptor to the pool */ 
8 р->с]їепїїа[1] = connfd; 
9 


Rio readinitbí(&p-»clienrrioíil, connfd!; 
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10 

11 % Add the descriptor to descriptor set */ 

12 FD SETíconnfd, &p-»read set); 

13 

14 /* Update max descriptor and poo! highwater mark */ 
15 if (connfd > p-»maxfd! 

15 p-»maxfd = соппЁ@; 

17 if (i >р->штахі) 

| 8 р->лахі = 1; 

19 break; 

20 ) 

21 if (1 == FD _ SETSIZ3} /* Couldn't find an empty slot */ 
22 app errorí"add client error: Tco many clients"]; 
23 ] 


code/conc/echoservers.c 
图 1310 add client: 3s — 3B Pm |Р 


check clients 【图 03.10. PEDE BERE TIE RAE IL E АЮ ХАТ. WERI 
功 地 从 描述 符 读 取 了 一 个 文本 行 ， 那 么 我 们 就 将 该 文本 行 回 送 到 客户 端 【第 15 一 18 60. 注意， 在 
第 15 行 我 们 维护 着 ТАРЕ ЖЕКПЕ ЕИ ЕЛ TS ЖН. w RAAR ANERER 
端 ， 我 们 检测 到 БОЕ, ЖАТНУН (Ж 23 $10. 2E ure ER RGB AT 
(第 24—25 112. 


code/concf/echoseryers.c 


1 vold check clientsipool *р) 

2 { 

j int i, conntd, n; 

4 char bur[MAKXKLINE]; 

5 rio t rio; 

Š 

7 for ii = 0; {i <= D->max1) && (p-»nready > 0); l++) Í 

8 connfd = p->clientfdii]: 

9 rio = p-»clientrio[il]; 

10 

11 /* H the descriptor is ready, echo a text line from it */ 

12 1f ¿((connf3 > 0) && (FD ISSET(connfd, &o-»-ready веі) })} i 
13 p-»nready--; 

14 if (іп = aio readlinebi&rio, buf, MAXLINE)) != D) I 
15 byte cnt += n; 

16 printfí"Server received $d (£d tctLal) bytes on fd fdin", 
17 n, byte cnt, conríd); 

18 Rio writen[connfd, buf, п); 

19 ) 
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àl /* БӘР detected, remove descriptor from pool */ 
22 else [ 

23 Close(ccnnta); 

24 FD CLRíCOnntd, &p-»read set); 
25 D-»clientfd[i] = -1; 


code/conc/echoservers.c 
图 13.11 check clients: 为 准备 好 的 客户 端 连接 服务 


根据 图 13.7 中 的 有 限 状态 模型 ，select 函数 检测 到 输入 事件 , 而 add client 函数 创建 一 个 新 的 逐 
WEG RAH). check, clients 消 数 通过 回 送 输入 行 来 执行 状态 转 称 ， 而 且 当 客户 端 完 成 文本 行 发 送 
М, ЗЕ А ҒА. 


132.2 ЮО 多 路 复 用 技术 的 优 劣 

图 13.8 中 的 服务 器 提供 了 一 个 很 好 的 基于 UO 多 路 复 用 的 事件 驱动 编程 的 优 缺点 示例 。 事 件 驱 
动 设 计 的 一 个 优点 是 ， 它 比 基 于 进程 的 设计 第 了 程序 员 更 多 的 对 程序 行为 的 控制 。 十 如 ， 我 们 可 以 
县 想 编 写 一 个 事件 驱动 的 并 发 展 务 器 ， 为 某 些 客户 端 提供 它们 需要 的 服务 ， 而 这 对 于 基于 进程 的 并 
发 服务 器 来 说 ， 是 很 图 难 的 。 

另 一 个 优点 是 ，- -个 革 于 VO 多 路 复 用 的 事件 驱动 服务 器 是 运行 在 单一 进程 上 下 文中 的 ， 因 此 
每 个 邮 辑 流 都 能 访问 该 进程 的 全 部 地 址 空间 。 这 使 得 在 流 之 间 共 享 数 据 变 得 很 容易 ， 作 为 单 -- 进 程 
运行 的 - -个 相关 忧 点 是 ， 你 可 以 利用 热 悉 的 调试 工具 〈 例 妇 СОВ) 来 调试 你 的 并 发 服务 器 ， 就 像 对 
顺序 程序 那 简 。 最 后 ， 事 件 蝶 动 设计 常常 比 基 于 进程 的 没 计 要 明显 地 高 将 得 和 多， 因为 它们 不 要 求 有 
进程 上 下 文 切换 来 调度 新 的 流 ， 

事件 驱动 设计 一 个 明显 的 缺点 就 是 编码 复杂 , 例如 ， 我 们 的 事件 驱动 的 并 发 echo 服务 器 需要 的 
代码 比 林 于 进程 的 服务 器 名 三 信 ， 并 且 很 不 幸 ， 随 着 并 发 性 粒度 的 减 小 ， 复 杂 性 还 会 上 升 。 这 里 的 
娄 度 是 指 每 个 贸 辑 流 每 次 时 间 片 执行 的 指令 数 日 。 例 如 ， 在 我 们 的 示例 并 发 服务 器 中 ， 并 发 粒度 襄 
是 读 一 个 完整 的 文本 行 所 需要 的 指令 数 日 。 只 要 某 个 逻辑 流 正 忙于 读 一 个 文本 行 ， 其 他 逻辑 流 就 不 
串 能 有 进展 。 对 我 们 的 例子 而 言 这 就 很 好 了， 但 是 它 第 得 我 们 的 事件 张 动 服务 器 在 “故意 内 发 送 部 
分 六 本 行 然后 斌 停止 ”的 严 意 客户 端的 攻 测 面前 显得 很 脆弱 。 眉 改 事 什 瞩 动 服务 器 来 和 处 理 部 分 交 本 
行 不 是 一 个 简单 的 任务 ， 介 是 基干 进程 航 设 计 却 能 处 理 得 很 好 ， 而 且 是 自动 处 理 的 。 


ЖУН 13.3 

在 大 多 数 的 Unix 系统 至 ， 在 标准 输入 上 键入 ctrl-d 表示 EOF. d» 0 13,6 中 的 程序 阻塞 
在 对 select ИНЕҢ ЕҢ, л сопа Ж ЖАРА? 

АУ 13.4 


Hj 13.8 所 示 的 服务 器 中 ， 我 们 在 每 次 调用 select 之 前 都 立即 小 心地 重新 初始 化 pool. ready_set 
变量 . ЖНА? 
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133 ”基于 线程 的 并 发 编程 


AWALE 我 们 己 经 看 到 了 两 种 创建 并 发 逻辑 流 的 方法 。 在 第 -种 方法 中 ， 我 们 为 每 个 流 汪 
АОЛ. РЕНАТА НЕ. 每 个 进程 有 它 和 白 己 的 私有 地 址 空间 ， 这 使 得 流 夫 上 这 数 
ЖЕЖ. 在 种 一 种 方法 中 ， 我 们 创建 自己 的 逻辑 流 ， 并 利用 TO 多 路 复 用 来 显 式 地 调度 流 。 国 为 
只 有 -个 进程 ， 所 有 的 流 共享 整个 地 址 空间 。 这 一 节 介 绍 第 二 种 方法 一 一 基于 线程 一 一 它 着 这 两 种 
方法 的 混合 。 

个 线程 《thread) 就 是 运行 在 一 个 进程 上 下 文中 的 :个 墨 辑 流 。 记 今 在 本 书 里 ， 我 们 的 程序 
玫 昨 由 一 个 进程 中 一 个 线程 给 成 的 。 仙 是 现代 系统 也 允许 我 们 编写 一 个 进程 里 同时 运行 多 个 线程 的 
程序 。 线 程 由 内 核 自动 滑 上 度 。 每 个 线程 都 有 它 白 己 的 线程 上 下 文 “thread context)， 包 括 一 个 惟一 的 
整数 线程 ID (Thread iD，TID)、 栈 、 栈 指针 、 程 序 计数 器 、 通 用 日 的 寄存 器 和 条 人 忻 公 。 所 有 的 运 
行 在 一 个 进程 里 的 线程 共享 该 进程 的 整个 虚拟 地 址 空间 。 

基 十 线程 的 逻辑 流 结合 了 基于 进程 和 基于 VO 多 路 复 用 的 流 的 特性 。 同 进程 一 样 ， 线 程 由 内 核 
Har, FARRE :个 整数 D 来 识别 线程 。 问 基于 VO 多 路 复 用 的 流 一 样 ， 儿 个 线程 运行 在 
单 “ 进 程 的 上 下 文中 ， 央 此 其 亭 这 个 进程 虚拟 地 址 空间 的 整个 内 容 ， 所 括 它 的 代码 、 数 据 、 推 、 共 
近 库 和 打开 的 文件 。 


13.3.1 线程 执行 模型 

多 个 线程 的 执行 模型 在 其 些 方面 和 多 进 程 的 执行 寞 型 是 很 相似 的 。 思 考 一 上 图 13.12 (Р ҰЙ, 
每 个 进程 开始 生命 周期 时 部 是 单一 线 穆 ， 这 个 线程 称 为 主线 程 (main thread)。 在 某 一 时 刻 ， 主 线程 
创建 “个 对 每 线程 《peer thread)， 从 这 个 时 间 点 开始 ， 两 个 线程 就 并 发 运行 。 最 后 ， 因 为 主线 程 执 
行 FS АНЫН, DUH read 或 者 sleep， 或 者 因为 它 被 系统 的 间隔 计时 器 中 斯 ， 控 制 就 会 通过 
上 下 义 切 换 千 递 到 对 等 线程 。 在 控制 传递 冉 主 线程 前 ， 对 等 线程 会 执行 一 段 时 间 ， 依 次 类 推 。 


ET E, 
线程 1 线程 2 
HRR) (HIRA) 


YE КЕЖЕ 


Y 8 F F Jin 





PERREFXUR 





图 13.12 并 发 线程 的 执行 
在 “ 芋 重 要 的 方面 ， 线 程 执行 是 不 同 于 进程 的 。 因 为 一 个 线程 的 上 下 文昌 比 КЕШЕК 
小 得 名， 线程 的 上 下 文 切换 要 比 进程 的 上 下 文 切换 快 得 多 。 努 一 个 不 同 就 是 线程 ， 不 像 进程 那样 ， 
个 匡 控 照 严 格 的 父子 层次 来 组 织 的 。 和 一 个 进程 相关 的 线程 组 成 一 个 对 等 ( 线 科 ) 池 (a pool of peers), 
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MV PARARE Он. Toki НН ИНДЕ TE Е ВЕР МЕТКЕ. Ж 
等 (线程) БШПП Ami, -AREARE REAA R ЕСЕЛЕНЕДІ 
т^. КІЙ, УАН Pe НЕК ӘЛЕ А. 


13.32 Ровіх 线程 

Posix 线程 (Pthreads) ЖЕСЕНЯЯН АҒЫН МӘННЕН. ERTER 1995 +£, ПЫ 
在 大 多 数 Unix 系统 上 都 可 用 。Pthreads ЄЎ F K2 60 Ей, AETR, ЖҰМ kas, 
НА ЕЕ ЖӘЕ, Мул] САА АЛГА КЕ R SOUS REA. 

图 13.13 展示 了 一 个 简单 的 Pthreads ЕН. Е Ш TOM EHE. АЕ ЗЕРЕ BJ t 
等 线程 输出 “Hello, worldn” 并 日 终 小 。 当 主线 程 检 测 到 对 等 线程 终止 后 ， 它 驶 通过 调用 exit 终止 


code/conc/hello.c 
1 *include "csapp.h" 
2 void *taàreadivoid *уагар); 
3 
4 int malni) 
5 | 
Б pthread t tid; 
7 Pthread create(&tid, NULL, thread, NULL); 
B Pthread_ joinítid, NULL): 
9 ехіс (9); 
1C | 
11 
l2 void *threaedivoid *vargp) /*thread routine */ 
i3 Í 
14 кїл f i "Hello, world'*n"»; 
15 return NULL; 
16 } 


- — 


ІҢ 13,13 hello.c: Pthreads "Hello, wordi” ЖҰБЫ 


这 是 我 们 看 到 的 第 -个 线程 化 的 程序 ， 所 以 让 我 们 仔细 地 解析 它 。 线 程 的 代码 和 本 地 数据 被 封 
丢人 在 -一 个 线程 例 程 【thread routine) 中 。 正 如 第 二 行 里 的 原型 所 示 ， 每 个 线程 例 穆 圭 以 一 个 通用 指 
秆 作为 和 输入 ， 并 返回 一 个 通用 指针 。 如 果 你 想 传 递 儿 个 参数 给 线程 例 程 ， 那 么 你 应 该 将 参数 放 到 -- 
个 结构 中 ， 并 传递 一 个 指向 该 结构 的 指针 。 硝 似 地 ， 如 果 你 想 要 线程 例 程 返 回 多 个 参数 ， 你 可 以 返 
加 一 个 指向 -个 结构 的 指针 。 

第 4 行 标 出 了 主线 程 代码 的 开始 。 主 线程 声明 了 一 个 本 地 变量 па. 它 可 以 用 来 存放 对 等 线程 的 
HF ID :第 5 行 )。 主 线程 通过 调用 pthread create 函数 创建 - :个 新 的 对 等 线程 CB T. Up 
pthread create 的 调用 返回 时 ， 主 线程 和 新 创建 的 对 等 线程 并 发 和 运行， 并且 tid 包含 新 线程 的 ID. Ж 
过 调用 pthread join TRATARANSE (Esi Ba, ARAH exit (9 917), 终止 
当时 运行 在 这 个 进程 中 的 所 有 线程 (在 这 个 示例 中 就 上 只 有 主线 程 )， 

第 12—15 行 定义 了 对 等 线程 的 线程 例 程 。 它 只 打印 一 个 字符 串 ， 然 后 就 通过 在 第 15 行 执行 





cadefconcfhello.c 
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return ЖА Ж КАЖ. 


13.33 创建 线程 
线程 通过 调用 pthread_create ЖЕЛ ЕНЕҢ, 


Kinclude <рїһгеад.һ> 
typedef void *(func)ivoid %); 


int pthread create(pthread t *tid, pthread attr L *attr, 
func *f, void *arg); 





大 成 功 则 返回 0， 孝 出 错 见 为 非 党 。 


pthread create 蝴 数 创建 一 个 新 的 线程 ， 并 带 着 一 个 输入 变星 ар, АЕ РАТ 
程 例 程 了 ЕЛІ айт 参数 来 眼 柴 新 创建 线程 的 默认 属性 .改变 这 些 属 性 已 超出 我 们 学 习 的 范围 ， 并 且 
在 我 们 的 示例 中 ， 我 们 总 是 用 一 个 空 的 atr 参数 来 调用 pthread_create Ж. 

二 pthread, create 返 同 时 ， 参 数 tid 包含 新 创建 线程 的 DD。 新 线程 可 以 通过 调用 pthread_self Ж 
Ж ЖАНЕ Но BJ Тр. 


#include «pthread.h» 


pttread і pthread seltfívoid!; 





返回 调用 者 的 线程 ID. 


13.3.4 绪 止 线程 
一 个 线程 是 以 下 列 方式 之 一 来 终止 的 ， 
. ЧЛЕН, ЕЕ ЖІК. 
° 通过 调用 pthread, exit ЕЖ, REGEA WA |. 该 函数 会 返回 一 个 指向 返回 值 thread_return 
РИЕП. ПЕСЕН pthread_exit， 它 会 等 待 所 有 其 他 对 等 线程 终止 ， 然 后 骨 终 小 十 线 
往 和 整个 进程 ， 返 回 值 为 CQhread return. 


#include «ptLread.h» 


int pthread exit(vo:d *thread return!; 





im 18800, Ed ЯЗ} , 


e 菏 个 对 等 线程 调用 Unix 的 exit АЙ, АТЕВ RET БЕЛЕП ЕТЕ. 
. 为 一个 对 等 线程 通过 带 调用 当前 线程 ID 来 的 pthread_cancle 函数 来 终 目 当前 线程 。 


*include <pthread.h> 


int pthread, cancelípthread t tid); 





ЖЖ НЫ 0, ЖІ 3E. 


13.35 回收 已 终止 线程 的 资源 
线程 通过 调用 pthread_join 函数 等 待 其 他 线程 终止 
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iinciude «pthread.h- 


int pthread,joiní[pthread, - tid, void **thread, return); 


ЖАНЫ 0, ЖЕЛІ ЗЕ, 





pthread join 22:83, 用 到 线程 па 7€ 1E ЕТЕРІ ERR [B] FJ Суоа ВЕ ЖАН А thread, return 
HAREE, Куак ЕШ НМ НЕ ЕЕ. 

注意 ， 和 Unix 的 wait 函数 不 同 的 ，pthread_joit 函数 只 能 等 待 一 个 指定 的 线程 终止 。 没有 办 法 
让 pthread wait ЕЕЕ -个 线程 线 站 。 这 使 得 我 们 的 代码 更 加 复兴 ， 内 为 它 迫 使 我 们 去 使 用 其 地 
一 些 不 那么 直观 的 机 制 来 检测 进程 的 终止 。 实 际 上 ，Stevens 在 [81] 中 就 很 有 说 最 为 地 论证 了 这 是 -- 
个 错误 。 


13.3.6 分 离线 程 

在 任何 -- 个 时 间 点 上 ， 线 程 是 可 结合 的 (joinable) REEDE) (detached). 一 个 可 结合 的 线 
ТЕ НЕЗ ЖК И.Ш ЖЕЛЕСИ] НЕНА ДЖЕ. ЖЕНТЕК УТ. ЕРЕН (ИШЕ) ЖАН 
ДАЙ». ЖЫ, КАЧ EE Ra EI LS. ЕРИ ЕЕ ЕЕ IL il ЖЖ 
BEEN. 

AAR F, MERI RIA. AI ESAE алш. НТ ША ЖО MER 
МЕЕ 07 AMI, Ж АЛТИ pthread detach AAR Т. 


include <pthread.h> 


| int pthread, detach(pthread t tid): 
| FRAIES 0, hdi] 3E. 
pthread, detach 函数 分 离 可 结合 线程 па. НКЕ КЕРА pthread хе) 5 305 pthread detach 
RERA EB C. 
尽管 我 们 的 一 些 例 了 会 使 用 可 结合 线程 , (EUELEDUSCERHUP, 有 理由 要 使 用 分 离 的 线程 。 例 如 ， 
一 个 遍 性 能 Web 服务 器 可 能 在 每 次 收 到 Web 浏览 器 的 连接 请 求 盯 都 创建 一 个 新 的 对 等 线程 。 因 为 
每 个 连接 都 是 由 - -个 单独 的 线程 独立 处 理 的 ， 所 以 对 于 眼 务 器 而 言 ， 就 很 没有 必要 一 一 实际 上 也 不 
愿意 一 一 显 式 地 等 待 每 个 对 等 线程 终止 。 在 这 种 情况 下， 每 个 对 等 线程 者 应 该 在 它 开 始 处 理 请 求 之 
前 ， 分 离 它 白 身 ， 这 样 就 能 在 它 终止 后 ， 回 收 它 的 存储 器 资源 了 。 
13.37 初始 化 线程 
pthread_once ЕШ ТҮННЕН ИЕН НАҚ. 


#ircluj3e «pthread.h- 


pthread once t once control = PTHREAD ONCE ТЇ"; 


int ptaread once(pthread once t *once control, 
vold (*init routine!ivoid)): 
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once contro] 演 量 是 一 个 全 局 或 者 静态 变量 ， 总 是 被 初始 化 为 PTHREAD_ONCE_INIT。 当 你 第 
一 次 用 参数 once control 调用 pthread_once 时 ， 它 调用 init_routine， 这 是 一 个 没有 输入 参数 ， 也 不 
返 思 什么 的 图 数 。 接 下 来 的 以 once, control! 为 参数 的 pthread_once Ў AR f CE E. ЖЕН, 
当 你 需要 动态 初始 化 多 个 线程 共享 的 全 局 变量 时 ，pthread_once KERTA. Ed MEAE 13.6 节 
里 看 到 一 个 水 例 。 


13.3.8” 一 个 基于 线程 的 并 发 服务 器 
图 13.14 展 小 了 基于 线程 的 开发 echo 服务 器 的 代码 。 整 体 结构 类 似 于 基于 进程 的 设计 。 主 线程 
不 断 地 等 待 连接 请 求 ， 然 后 创建 一 个 对 等 线程 处 理 该 请 求 。 虽 然 代 码 看 似 简 单 ， 但 是 有 几 个 普遍 而 
有 和 些微 妙 的 问题 需要 我 们 更 他 细 地 看 一 看 . 第 一 个 问题 是 当 我 们 调用 pthread_create 时 ， 如 何 将 局 
连接 拍 述 侍 伟 遍 络 对 等 线程 。 最 明显 的 方法 就 是 传递 个 指 同 这 个 描述 符 的 指针 ， 就 像 下 面 这 样 
connfd = Accept (listenfd, (БА %) &clientaddr, &clientlen): 
Pthread _ create[(&tidqd, NULL, thread, &connfd); 
Жол, Sd RRRA RAE ЕВНА ЈАНА Е, D PED 


void *threadi(void *уагак} { 
int connfd = *((int *)vargp); 


| 


然而 ， 这 样 可 能 会 出 销 ， 因 为 它 在 对 等 线程 的 赋值 请 名 和 主线 程 的 accept 语句 加 引入 了 竞争 
(race). АЛАН НЕ F— F accept 之 前 完成 ， 埋 么 对 等 线程 中 的 局 部 变量 connfd 就 得 到 正确 的 
1ш Н» ЖАП, W RRR O EE accept 之 后 本 完成 的 ， 那 么 对 等 线程 中 的 局 音 变 量 connfd 就 得 
到 下 一 饮 过 接 的 描述 答 值 , 那么 林 说 的 结果 就 是 , 现在 两 个 线程 在 同 -个 描述 符 上 执行 输入 和 输出 。 
为 了 区 锡 这 种 潜在 的 致命 竞争 ， 我 们 必须 将 每 个 accept 返回 的 已 连接 措 述 符 分 配 到 它 白 己 的 动态 分 
ЮШДЕ. ШЖ 20-21 行 所 示 。 我 们 会 在 13.7.4 和 节 中 回 过 来 讨论 竞争 的 问题 。 


code/conc/echoservert.c 
Kinclude "ocsapp.h" 


void echoíint conrtfd); 
vold *tnread[void *vargp': 


( 


int listenfd, *connfdo, port, clientlen-sizeof(struct sockaddr im); 


l 

2 

3 

4 

5 

6 int mainiit ағас, char **атоу) 

i 

8 

9 struct sockad3-_ in clientaddr; 
1 


0 pthread t tid; 
11 
12 if {агас != 2) í 
13 fprintf[ístderr, "usage: &s «port»in", arqgv[0]); 


] mi phread once. — --- 译 者 
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24 ex1t (D) ; 

15 } 

16 pork = atolí(argv[1]]; 

17 

18 listentd = Open, listenfdíport); 

19 while (1) í 

20 connfdp = Mallocíisizeofíint)); 

21 *connfdp = Acceptilistenfd, (SA %) &clisentaddr, &clientlen); 
22 Ptnread createi&tid, NULL, thread, connfdp); 
23 } 

24 |) 

25 


26  J* thread routine */ 


27  woid *threadívoid *vargp! 


2B d 

29 int cornfd = *((int *)vargp): 
37 Pthread detach(pthread self(!: 
il Free(vargp): 

32 echotconntd): 

33 Closeiconnfd) : 

34 return NULL; 

ib |] 


code/conc/echose rvert. c 


图 13.14 ”基于 线程 的 并 发 echo 服务 器 
A -个 问题 是 在 线程 例 程 中 避免 存储 器 泄漏 。 距 然 我 们 不 显 式 地 站 呵 线程 ， 我 们 就 必须 分 离 每 
小 线程 ， 居 得 它 有 的 存 情 器 资源 在 它 终 止 时 能 够 被 收回 【第 30 行 )。 更 进一步 ， 我 们 必须 小 心 释放 主 
线 可 分 配 的 存储 器 块 ‘第 31 47), 
练习 题 13.5 
在 图 135 中 基于 进程 的 服务 器 中 ,我 们 在 两 个 位 置 小 心地 关闭 了 已 达 接 描述 特 ， 父 进程 和 子 进 


€. Hm. ER 13.14 中 基于 线程 的 服务 嚣 中， 我 们 只 在 一 个 位 置 关闭 了 已 连 禄 描述 符 ; 对 等 线程 
为 什么 ? 


134 ”多 线程 程序 中 的 共 邓 变量 


从 一 个 程序 员 的 角度 来 看 ， 线 程 很 豚 引力 的 一 个 方面 就 是 多 个 线程 很 容易 共享 相同 的 程序 变 
量 。 人 然而， 这 种 共 芭 由 是 很 杯 玫 的。 为 了 编写 正确 的 多 线程 程序 ， 我 们 必须 对 所 谓 的 共享 以 及 它 是 
如 何 工 作 的 有 很 清楚 的 了 解 。 

为 了 理解 忆 狂 序 中 的 一 个 变量 是 否 是 共享 的 ， 有 -- 些 基本 的 问题 要 解答 ; 线程 的 基础 存 销 器 模 
型 是 什么 ?根据 这 个 模型 ， 变 量 实 例 是 如 何 映射 到 存 铺 器 的 ? 最 后 ， 有 多 少 线程 引用 这 些 实例 ? - 
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个 变量 是 共 享 的 ， 当 由 仅 当 多 个 线程 引用 这 个 变量 的 某 个 冬 例 。 

为 了 让 我 们 对 共 襄 的 讨论 具体 化 ， 我 们 将 使 用 图 13.15 ЕНЕ “УАТ АР. ЖЕН 
人 为 的 痕 壕 ， 但 是 它 仍 然 值 得 研究 ， 因 为 它 说 明 了 关于 共 时 的 许多 细微 之 处 ， 不 例 程 序 由 一 个 创建 
了 两 个 对 等 线程 的 主线 程 组 成 。 主 线程 传递 一 个 惟 ~ 的 ID 给 每 个 对 等 线程 ， 每 个 对 等 线程 利用 这 
个 ID 输出 一 条 个 性 化 的 信息 ， 以 及 调用 该 线程 例 程 的 全 部 次 数 的 数值 。 


cpde/conc/sharing.c 


1 &include "csapp.h" 

2 define N 2 

3 void *thread(void *vargDi; 
4 

5 char **ptr; /* global variable */ 
6 

1 int maní) 

B { 

9 int 1; 

10 pthread t tid; 

11 char *msqs[N] = í 

12 "Helio from foo", 

13 "Hello from bar" 

14 H 

15 

16 ptr - msqs; 

17 for [1 = 0; i < N; i++] 
18 Pihread create(&tid, NULL, threac, (void *)i); 
19 Pthread exit (NULL); 
20.1 

21 

42 void *thread(void %уағар) 
23 f 

24 int myid = !int)varzdp; 
25 static int cnt = 0; 

26 printft"[%3): $s (cnt-*d)in", myid, ptr[myid], ++спї}; 
27 ) 


code/conc/sharing.c 


图 13.15 说 明 共享 不 同方 面 的 示例 程序 


13.41 线程 存 情 器 模型 

-组 并 发 线程 运行 在 “个 进程 的 上 小 文昌。 每 个 线程 者 有 它 自己 独立 的 线程 上 下 文 ， 包 括 线程 
ID、 上 栈 、 栈 指针 、 程 序 计数 器 、 条 件 代码 和 通用 日 的 寄存 器 值 ， 每 个 线程 和 其 他 线程 -起 共享 进程 
上 下 交 的 剩余 部 分 。 这 包括 整个 用 户 虚 拟 地 址 空间 ， 它 是 由 只 读 文本 代码 )、 污 /号 数 据 、 推 以 及 
所 有 的 共享 库 代 人 码 和 数据 区 域 组 成 的 。 线 称 也 共享 同样 的 打开 文件 的 集合 ， 

从 实际 操作 的 角度 来 说 ， 让 一 个 线程 去 读 或 号 另 一 个 线程 的 寄存 器 值 是 不 可 能 的 。 另 一 方面 ， 
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FE] £e FERE n] UL vr n] X HE PLEBS НАУ В. MIRA FPO ВАМУ BS ЯА RAS 
每 个 线程 最 终 都 能 在 它 读 这 个 位 置 时 发 现 这 个 变化 。 因此， 寄存 器 旦 从 不 共享 的 ， 而 碟 氢 存储 器 总 

各 自 独 立 的 线程 栈 的 存储 器 模型 不 是 那么 整齐 清楚 的 。 这 些 乒 被 保存 在 庆 拟 地 址 罕 疝 的 栈 区 域 
中 ， 并 县 通 第 是 秆 它们 相应 的 线程 独立 地 访问 的 。 我 们 说 通常 而 不 是 总 是 ， 是 因 汶 不 同 的 线程 栈 是 
不 对 其 他 线程 设防 的 。 所 以 ， 如 果 一 个 线程 不 知 何故 得 到 一 个 指 网 其 他 线程 栈 的 指 秆 ， 那 么 它 束 可 
以 该 写 这 个 栈 的 任何 部 分 , 我 们 的 示人 恒 程 序 在 第 26 行 展示 了 这 一 点 ,其 中 对 等 线程 下 楼 通过 全 局 变 
E ptr 引用 主线 程 的 贱 的 内 容 ， 


1342 将 变量 映射 到 存储 器 
多 线程 的 忆 程序 中 的 变量 根据 它们 的 存 鱼 类 型 被 映射 到 虚拟 存储 器 。 
. 全 局 变 量 。 全 局 变量 是 定义 在 函数 之 外 的 变量 。 存 运行 时 ， 虚 拟 存 储 器 的 读 / 写 区 域 只 包含 
每 个 全 局 变量 的 一 个 实例 。 例 如 ， 算 5 行 声明 的 全 局 变量 ptr 在 虚拟 存储 器 的 读 / 写 区 域 中 
有 -个 运行 时 实例 。 当 -一 个 变量 只 有 一 个 实例 时 ， 我 们 只 用 变量 名 一 一 在 这 里 就 是 ptr 一 - 
来 表示 这 个 实例 。 
e 术 地 自动 变量 。 本 地 自动 变量 就 是 定义 在 随 数 内 部 但 是 没有 static 属性 的 变量 。 在 运行 时， 
每 个 线程 的 栈 都 包含 它 自己 的 所 有 本 地 自动 变量 的 实例 。 即 使 多 个 线程 执行 同 - -个 线程 例 
RN. 站 是 如 此 。 МШ, 有 一 个 本 地 变量 ан, ЕН Жет, ТІНІ ud. m 
来 表示 这 个 实例 。 再 来 看 -- 个 例子 , 本 好 变量 туй 有 两 个 实例 , 一 个 在 对 等 线 称 0 的 栈 内 ， 
男 - :个 在 对 等 线程 1 的 找 内 。 我 们 将 这 两 个 实例 分 别 表示 为 myid.p0 和 myid.pl. 
* 术 地 静态 变量 。 本 地 静态 变量 有 是 定义 在 函数 内 部 症 有 static 属性 的 变量 . MARTH- H, 
虚 披 存储 器 的 读 / 写 区 域 只 和 包含 在 程序 中 声明 的 每 个 本 地 静态 变量 的 一 个 实例 。 例 如 ， 即 感 
我 们 示例 程序 中 的 每 个 对 等 线程 者 在 第 25 (77539 T cnt， 存 运行 时 ， 虚 氢 存 情 器 的 读 / 写 区 
城中 也 只 有 一 个 ent 的 实例 。 每 个 对 等 线程 都 污 和 写 这 个 实例 ， 
13.43 ЖЕТЕ 
我 们 说 -个 变量 v 是 共享 的 ， 当 有 内 仅 当 它 的 -个 实例 被 一 个 以 上 的 线 种 引用。 例如， 我 们 示 创 
Елер cnt 就 是 共享 的 ， 因 为 它 只 有 一 个 运行 时 实例 ， 并 且 这 个 实例 被 丽 个 对 等 线程 引用 。 
在 另 一 方面 ，my 这 不 是 共享 的 ， 因 为 它 的 两 个 实例 中 每 一 个 都 只 被 一 个 线程 引用 。 然 而 ， 认 识 到 像 
msgs 这 样 的 本 地 自动 变量 也 能 被 共享 是 很 重要 的 。 
ЗН 13.6 
A. 利用 13.4 hi S RE, Ж 13,15 中 的 示例 程序 在 下 表 的 盘 修 条 目 中 填写 “是 ”或 者 “ 否 ”。 


在 第 一 列 中 ， 符 号 Vt 表示 变量 的 一 个 实例 ， 它 驻 留 在 线程 t 的 本 地 栈 中 ， 其 中 { 要 各 是 站 1 主线 
f£) БАЖ pQ 【对 等 线程 和) 或 者 pl (对 等 线程 1 )， 


nai: 
әне ЕНИ 
э | 

人 一 一 一 
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B. 根据 A 部 分 的 分 析 ， 变 醒 ptr. сп. і. msgs 和 myid 哪些 是 共享 的 ? 


13.5 用 信 号 量 同步 线程 


共性 灾 量 是 上 上 分 方 僵 ， 但 是 它们 也 引入 了 同步 错误 【synehronization error) 的 可 能 性 。 考 虑 图 
[3.16 中 的 程序 badentx<， 它 创建 了 两 个 线程 ， 每 个 线程 都 对 其 享 计数 变量 mI. 


-1 45 n найы M) n 


мо CD 


án 
AE 


code/conc/budcni.c 
$include "csapp.h" 


"define NITERS 100000000 
void *countívaid *arg); 


/* shared counter variable */ 
ud1signed int cnt = 0; 


ілі, maini} 


| 
pthread t tidl, tid2; 


PEhreac createi&tidl, NULL, count, NULL): 

Pthreac create[&tid2, NULL, count, NULL); 
chreac joinítidl, NULL); 

Pthreaà join(tid2, NULL); 


1f (cnt 1= {unsicned} NITERS*2) 
prinLtt["BOOM! cnt-tdMn", cnt); 
else 
printfi"OK cnt-$d'*n", ent); 
ехісій|; 


/* thread routine */ 
void *countívoid *arc) 
| 
int i; 
for (1 = C; i < NITERS; i«-) 
ЄЄП ++] 


并 发 编程 753 


31 return HULL; 
32 1 
code/concfbadeni с 


B 13,16 badcnt.c: 一 个 不 正确 同步 化 的 计数 器 程序 


因为 每 个 线程 都 对 计数 器 增加 了 NITERS 次 ,我 们 可 能 会 预计 它 的 最 余人 得 是 2*N[TERS$。 然 而 ， 
当 我 们 在 我 们 的 系统 上 送行 badcnte 时 ， 我 们 不 仅 得 到 错误 的 答案 ， 而 卫 每 次 得 天 的 答案 才 还 不 机 
[n] ! 

unix- ./badcnt 

BOOM! ctr-1888411853 

unix» ./badcnt 

BCOM! ctr-138261801 

unix» ./badcnt 

BOOM! ctr-i98269672 


AH ZH d ГЕ? УТ НИЕ А-ДЕ. TRU ЕРАК {ШШЕ ЫҚЫ, ШЇ 
13.7 所 未 。 我 们 发 现 ， 将 线程 i 的 循环 代码 分 解 成 五 个 部 分 是 很 有 帮助 的 ; 

e Н: ЯЛАН ЫННЫҢ ЗЕ. 

. Li 加 载 具 享 变量 ent 到 寄存 器 名 eax; ИНӘ, 218 Феах deco ERES РЕ ЇЇ ЖТ Феақ ER. 

. DU; 更 新 【增加 ) %eax 的 指令 。 

е 5: Ж еах T] E SHELL ЕЗЛЕНЕ сщ 的 指令 ， 

. Т. 循环 尾部 的 指令 块 ， 


Ex PE PR S С Р 


movl -4(%ерр), вах 
cmpl 599999999,%гау| > РЕ 





ВРВ G Н 
For {1=0; 1<Ы1ТЕН5; itt} = ctr, eax L,: Load ctr 
ctrt-; 1(5eax),teóx LU: Update otr 
ру} %ейх,сїт___ |) 9i Store ctr 


movl -а[%Жерр},%еах 

leal 1{feax}, ted: | 
movi %ейх,-4(%ерр) Тим, 
jmp .19 





m 13.17 bodcnic 中 计数 器 循环 的 把 32 汇编 代码 
HE EGLAURE HR EA EE. ті. U 和 5 操作 共 训 计数 器 变量 的 内 容 。 
23 badent.c 中 的 两 个 对 等 线程 在 一 :个 单 处 理 器 上 并 发 运行 时 ， 机 器 指令 以 某 种 呵 序 一 个 接 一 个 
地 完成 。 寺 此 ， 每 个 并 发 执行 定义 了 两 个 线程 中 的 指令 网 某 种 全 序 GREAT BO. АХЕМ, DUE 
序 中 的 一 些 将 会 产生 正确 结业 ,但 是 其 他 的 则 不 会 。 
这 里 有 个 关键 点 : 一 般 而 言 ， 体 没有 办 法 预测 操作 系统 是 否 皇 为 你 的 线程 选择 一 个 正确 的 顺 


xl o RG 


Ж. (ш, E 13.18 (a) йу ОЕА ERIT ЕВРЕ. EETA Т HEER ent 
Z, EEFE AINE 2. ЖЕЙН, €—J d. 13.18 Cb 的 厢 序 产生 一 个 不 
正确 的 cur 的 值 。 ЖЧ ЗАРЫ И ЖЕ h. HE ELS Bi ish enn. 是 在 第 2 ЕВО Т Л cnt 
Zh. MER ó +R I НЕКІБНЕШІНУШШ. НИ, ТРЕ РЕКЕ Е ВЕ ЕВЕ — ЧА PEE 
Br E Ж ЖИП. 





га) FANE 


=s 







(b) FERNET 
В 13.18 badcnt.c mg — rb e E hinia t 
Bur ES T РАЦ И iB BE (progress graph? ҮЙ & XE DR НЕ ix tt Z a HERD E dd >Ш 
"mE. W BRITT EF- ҮЛЕП. 


5 IN 13.7 
A ALT R P badentc И А8 8: 
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这 种 顺序 会 产生 一 个 正确 的 сш 45957 


13.5.1 进度 图 
一 个 进度 图 (progress graph》 将 个 并 发 线程 的 执行 模型 化 为 一 条 维 笛 卡 儿 空 间 中 的 轨 线 ， 
Ана МАРК. ЖТА bowo ЖАНЕ lys. 已 经 完成 了 指令 五 这 一 
状态 。 图 的 原点 对 应 于 没有 任何 线程 完成 一 条 指令 的 初 迷 状 态 。 
图 13.19 展示 了 badent.e 程序 第 一 次 循环 迁 代 的 二 维 进 度 图 。 水 平 轴 对 应 于 线程 1, + ИҢ IV 
T2BI. н (Lo S) 对 应 于 线程 1 完成 了 已 而 线程 2 完成 了 5 ВАКА. 
线程 2 





БЕРІ 1 


f L UU S T 


13.19 bodcnt.c 第 一 次 循环 迭代 的 进度 
-个 进度 图 将 指令 执行 模型 化 为 一 个 从 一 种 状态 到 另 一 种 状态 的 转换 《transition )。- :个 转换 被 
表示 为 一 条 从 一 点 到 硼 邻 点 的 有 向 边 。 合 法 的 转换 是 向 右 (线程 1 中 的 一 条 指令 完成 ) 或 者 向 上 ( 线 
Fe 2 中 的 一 条 指令 完成 ) 的 。 两 个 指令 不 能 在 同 ~- 时 刻 完成 一 一 对 角 线 转换 是 不 允许 的 。 程 序 决 不 
会 问 运 行 ， 所 以 向 下 或 者 向 左 移动 的 转换 也 是 不 合法 的 。 
一 个 程序 的 执行 历史 被 模型 化 为 状态 空间 中 的 一 条 轨 线 ,图 13.20 展示 了 下 面 指令 顺序 对 应 的 
PUX: 
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H. Li: Us H;. ЕТ M [IT [^ 5s T: 


ы. 
E * - z 
Т; 
E 
8; 
т = + 





E1320 чм 


“сң, ЖЕЛЕ cat БІЗІҢ? CL. U. 50 构成 了 一 个 【关于 共享 变量 cnt 的) W 
Ж (critical section), 3X T- lig RI Аа ЕНІН ED E PERLES РАТУЕ Е ЕНТ] 
状态 空间 称 为 不 安全 区 (unsafe region). [8 12.31 属 示 了 变量 m 的 不 安全 区 , ЕЙ. 不 安全 区 和 与 
ЕНЕ, FOP SE Katika. Иш. RS (Н. H.) 和 (S. UD MUSA KE, 
但 是 它们 井下 是 下 安全 区 的 一 部 分 。 





Ta 
5; 
T er ir 
Ax us | 
Ls 
H; 
HN 
H, L. u, Ši T, B ! 


Ert 
41321 临界 区 和 十 安全 区 

с е ЧА ПЦ А Е, (safe trajectory). HE. EEE TE Ee УА a i T 
жің Lunsafe тассіюту). 图 13.22 £818. T RECIPERE badal HRS 7r [8] 92 i ga RI 3E 
ең, psp ET у а Lig. NERA). PEU RET ERE. ІН 
Еле. 

НЕН ТЕ НЬ ЕН ИШ. ЖТ OFE ЖЕРИН CILE RUIT EI 
ЖЕБЕ ГИ ЗЕ ap a ИЕ ЕНИ КЕ РЕЙПЕШНАТТ———йП1@ИШ ERR КЕФ НИЕ. ТЕТЕ 
a 3 Йй. 
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JE Es: 


E cnt 的 临 
界 区 


HE 1 





— 一 一， 一 —.. 
T cnt 的 临界 区 
13.22 安全 和 不 安全 雪线 


13.52 利用 全 号 量 访问 共享 变量 

Edsger Dijkstra， 理 解 各 阐明 开发 编程 领域 的 先 笠 人 人物 ， 提出 了 一 种 绎 典 的 解决 同步 不 同 执行 线 
程 问题 的 方法 ， 这 种 方法 是 基 寺 一 种 叫做 信号 量 semaphore) 的 特殊 类 型 变量 的 。 信 号 基 s 是 具有 
非 负 束 煞 值 的 全 局 变量 ， 只 能 由 两 种 特殊 的 操作 来 处 理 ， 这 两 种 操作 称 为 严 和 V. 

. P(s ШЕ» EEF, ЛАР. ЈЕНЕ). 如 果 s 为 零 ， 那么 就 挂 起 进程 ， 
直到 EEF, ВЕЖЕ -个 YV 操 作 重 启 。 在 重启 之 后 ，P 拱 作 将 s 减 1， 并 将 控制 
退回 给 调用 者 。 

ь М): V 操作 将 s AD 上。 如 果 有 任何 进程 蛆 塞 在 产 操作 等 待 * 变 成 非 零 ， 那 么 操作 会 重启 
这 些 进 程 中 的 一 个 ， 然 后 该 进程 将 了 减 !， 完 成 它 的 也 操作 。 

Р RRIARI 1 操作 是 不 可 分 割 的 ， 也 就 是 说 , 一旦 预测 5s 变 为 非 雷 ， 就 会 将 减 1， 不 能 有 

中 断 。Y 中 的 加 1 操作 也 是 不 可 分 割 的 ， 也 就 是 加 载 、 加 1 和 存储 信号 量 的 过 程 中 没有 中 断 。 


Er. ЖЕР Ж УШ 


Edsger Dijkstra ШЖ, АТРМУЖАТЖ ЖЕН Proberen (ЖНЖ) se Verhogen ОЙ 
№), 


Pf V ЖАЙТ А АЕ ТВЕНА ВЕНОК, €x RET ЕЛЕМЕДІ ЕНЕ 
号 量 有 一 个 负 信 。 这 个 局 性 称 为 信号 量 不 变性 Csemaphore invariant), ЕЕ БІНЕ АТО 
Те АТАЛЫ А. 

基本 的 思想 是 将 每 个 共享 变量 (或 者 相关 共 上 学 变量 集合 》 与 - -个 信号 晤 s 《初始 为 D 联系 起 来 ， 
然后 用 PA Vis) 操 作 将 相应 的 临界 区 包围 起 来 。 以 这 种 方式 来 保护 共享 变量 的 信号 量刑 做 二 进 制 
信号 量 (binary semapbore}， 因 为 它 的 值 总 是 0 或 者 1. 

图 13.23 中 的 进度 图 展示 了 我 们 如 何 利 用 信号 量 来 正确 地 间 步 我 们 的 计数 器 程序 示例 。 和 餐 个 状 
访 都 标 出 了 该 状态 中 信号 量 s 的 信 。 关 键 概 念 是 这 种 p 和 VW 操作 的 结合 创建 了 一 组 状态 ， 叫做 禁止 
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Hus inco SEA 











TEES 
| al E ы ,U п в" m. 
Ta 
al! t a £t Я = ! b ' 
Vis) 
p E E „9 
5; 
ü E E E 
Ц, 
а E к. 10 
ы p “ „1 „* 
"a i 1 E Қ. „9 „® i „! 
Ha L ! Ü и ё E i M 
Hi Pis] Li | Ui Š, vig] T, | — 
图 1323 司 用 信号 量 的 安全 共享 
кєй ЕЕЕ gT—T«RIETETEUSESEB. 
НЕШ А ЕЖ, h P Уу 1177 15123 КЕНЕН Gi E 


p, ЖЕ Н ЕЗІНЕ. B5. ТАЗ ЖИЕ Т eh WDCH S ЕР] mutually 
exclusive access). ВЕНЕ Ў ЖЧ ER (mutual exclusion J. 

— Hi, НЕН EI iW NC CR ЕЕ (maer) ER FEBR ERU P 
НЕШ. ИШЕ, TV ИЕП. — DEN HE ШИНЕ W АЕ ЕШ 
B 5 mnt e. 

BE PEHR 

HERTAN- HREN E, MERRER LARRARTE cT 
ғафан9. Mae CHA Ted Su, ШИЛТЕ SEE EH X АТ, —Ш СРО 
uk nedELA IA) Юе THI 3ASIEAB TIM. ЯНА. -t 
93A ToU E #5, жа TË ARB TIKA. KET, hita He: RE 
Jr kx ЖЕН. 


135.3 Posix ЕШ 
Posx ВЕЖЕ ТОВ AERAN. ЕЖІНІМЕН sem init. sem, wait (P #fE) A 
sem post CV BP. 





并 发 编程 759 


#include <ветарпоге.һ»> 


int sem initísem t "sem, 0, unsigned int value); 


int sem waltí(sem t *s): /* P(s) */ 
int sem postí(sem.t *s); /* Vis) */ 





i&m xA x0. 10-1. 
一 个 程序 道 过 调用 sem init. 函数 来 初始 化 一 个 信号 量 。sem_init ЖИН = sem 初始 化 为 
value, fs EXEIEIBB ANGE. НОУ А Т. mas Sd use RS BIO BDRSDRHI 
sem wait f! sem post КАЖ АТ PA VHF. ЖТИ, Э ЕЕ А F 8] BU PRIV BUE C wrapper? 
EE 


tinclude "csapp.h" 


void Písem t *s); /* Wrapper function for sem маш */ 
vold Visem t *s]; /* Wrapper function for sem post */ 





Wing, 3 ГЕРАТ Жл 0], RIEKA i mutex Bip ӨЗ: 
sem t mutex; 

接 下 来 ， 在 主 例 程 中 ， 我 们 将 它 初始 化 为 一 : 

sem init (&mutex, 0. 1); 

Ene. RIAR mutex P PI V ЖЕ ТЕЕ ent 变量 ， 从 而 保护 它 : 


Pií&mutex!; 
Cnt; 
Ví&mutex!]; 


13.54 利用 信号 量 来 调度 共享 资源 

我 们 在 前 - -小 节 里 看 到 了 如 何 用 信号 量 来 提供 对 共享 变量 的 开 斥 访问 。 信 号 量 的 另 - 个 重要 作 
用 是 调度 对 共 储 资源 的 访 间 。 在 这 种 情况 中 ， 一 个 线程 用 信号 量 来 通知 另 一 个 线程 ， 程 序 状态 中 的 
某 个 乏 件 已 经 为 真 了 。 图 13.24 所 示 的 生产 者 和 消费 者 模型 是 一 个 经 典 的 示例 。 生 产 者 和 消费 者 线 
FCR У n АУРЫ. 


生产 者 线程 tH WA Fk EE 


图 13.24 生产 者 -消费 者 模型 
生产 者 产生 项 目 (иет) 并 把 它们 捅 入 到 缓冲 区 中 。 消 费 考 从 组 冲 区 中 上 取出 这 些 项 目 并 以 着 种 方式 使 用 它们 。 


生产 者 线程 肥 复 地 生成 新 的 项 目 (item)， 并 把 它们 播 入 到 缓冲 区 中 。 消费 者 线程 不 断 地 从 缓冲 
区 中 取出 这 些 项 目 ， 然 后 消费 它们 。 模 型 中 也 可 能 有 不 同 的 生产 者 和 消费 者 数量 。 
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ААЛ Н SEL E ES ERE. ЕГ ЕЕ РО КН И] а Ж. (RE 
ПЕНА АЧ О), ЗТ Е ER PP HW]. ШЖ рр АЙ СОП ШУ), 
ЛА ЕРЕ ААА AARE TRI. 与 之 相似 , НК ERE GOAL ПЕН ЫЛА Н э, 
МАНА АЕ BST НН. 

РЕЖ НЕНА EH ШЕ Ж ШІН. |I. КИЕ, "ЕР 
И Т. ПО АЕО ЛЕЕ АЕ „Шш Ж. BARKA OHE A ТАР АНН) Gitter), ІП 
iR ES] EHAA ОЕ E] 5; do E А Н РКЕ ИНТ 个 梢 位 池 ， 
TARRE В о. sy — ТЛ RTHEBUERIPEDI E. ЗЕРНА RE 
和 键盘 事件 ， 并 将 它们 插入 到 缓冲 区 中 。 消 费 者 以 基 种 基于 优先 级 的 方式 从 缓冲 区 到 出 这 些 事 件 ， 
ЖЕЛІНЕ, 

Аит, ПЕ EAR ES. PH Sbvf H ЖИП EPI Mm B P. AFETE, 
RISA Ser Hi ЖЇЗ РУДА ЖЕҢЕ, (prethreading) 的 一 个 有 趣 的 并 发 服务 器 。Sb*f 操作 类 型 
A sbuf t FIERI (Ж 13.25). 项 目 存 放 在 一 个 动态 分 配 的 n 项 整数 数组 中 。front 和 rear Ж (& ia. 
孙 修 数组 中 的 事项 和 最 后 一 项 。 三 个 信号 莉 控 制 对 缓冲 区 的 同步 访问 。mutex 信和 号 量 提供 互 斥 的 
RIPER Ej. slots 和 items 信和 与 量 分 别 记 录 空 模 位 和 可 用 项 目的 数量 。 


code/conc/sbuf. h 
1 typedef struct í 
2 int *buf; /* Buffer array */ 
3 int n; /* Maximum number of slots */ 
4 int front; /* buf[(front- 1 nl] is first item */ 
5 int rear; /* buf[rearen] is last item */ 
6 sem t mutex; Іі Protects accesses ta buf */ 
É zem t slots; ж Counts available slots */ 
H sem і items; ж Counts available items */ 
3 } sbuf 

code/conc/sbuf.h 


图 13.25 sbuf 1: 生产 者 -消费 替 程 序 的 一 个 共享 缓冲 区 


sbuf init ЖЖ ( # 13.26) 为 缓冲 区 分 配 堆 存储 器 ， 设 置 fron 和 rear cR — T BERE А. H 
为 二 个 信号 量 赋 初始 信 。 这 个 函数 在 调用 其 他 三 个 函数 中 的 任何 一 个 之 前 调用 M. 





code/conc/sbuf.c 
1 void sbuf init(sbuf t *sp, int n) 
2 i 
3 sp-»buf = Callocin, sizeofíint!); 
4 SD->n = n; /* Buffer holds max of n items 7/ 
5 sp-»frcnt = sp-»rear = 0; /* Empty buffer iff front == rear */ 
6 Sem iniL(&sp-»mutex, 0, 1); /* Binary semaphore for locking */ 
7 sem inití(&sp-»slots, 0, n); /* Initially, buf has n empty slots */ 
8 Sem inití(&sp-»ltems, 0, 0); /* Initially, buf has zero data items */ 
9 ) 

cede/conc/sbuf.c 


13.25 sbuf init: 初始 化 一 个 共享 绿 冲 区 


并 发 编程 761 


sbuf deinit СЫҢ ERER? АУН РЕ НУС ЕРЕСЕН, ЖЕЛИ PP RA НУ. sbuf insert 
KA СШ 1120 等 符 Tu NB. ЗН ЕЮШШ. Н. МЕҢШЕЯ, Raana 
Н. 


code/conc/sbuf.c 
1 void sbu£f insert(isbuf t *sp, int item) 
2 i 
3 Piksp-»slots); ж Wait for available slot */ 
4 Pi&Sp--mutex); Р Lock the buffer */ 
5 sp-»buf[|i(4-4sp-»rear)!*(sp-»n)] = item; /* Insert the item */ 
б V(&Sp-»mutex!; Ж Unlock the buffer */ 
7 V(&sp-»items); /* Announce available item */ 
Ë } 

code/conc/sbuf.c 


图 13.27 sbuf inser: 在 一 个 共享 绿 冲 区 的 后 部 插入 一 个 项 目 
这 个 函数 - HAAA -个 模 位 可 用 。 


sbuf remove 23 ( É] 13.28) 是 与 sbuf insert 图 数 对 称 的 。 在 等 符 一 个 可 用 的 组 神 区 项 日 之 
后 、 对 互 斥 锁 加 锁 、 从 时 冲 区 的 前 面 取出 该 项 目 、 对 互 斥 锁 解 锁 ， 然 后 发 信号 通知 -个 新 的 梢 位 


ӘРМЕН. 
code/conc/sbuf.c 
1 int shuf_removg(sbut_t Зер) 
2 i 
3 int item; 
4 D[&Sp->1Etems); /* Walt for available item */ 
5 P[(&sp-»mutex)?; /* Lock the buffer */ 
Б item = sp-»buf[í*«sp-»front)*(sp-on)]; /* Remove Ше item */ 
7 Viksp-»mutex); /* Unlock the buffer */ 
a Vi&zp-»5lots); /* Announce available slot */ 
© return item; 
100) 
code/conc/sbuf.c 


图 13.28 Sbuf remove: 从 一 个 共享 缓冲 区 的 前 部 取出 一 个 项 目 
这 个 函数 - 直 等 待 到 有 -- 个 项 目 可 用 。 


Ө: ЕЕ 

AT OG ДЕ T ЖЕБЕШ, 6 35352 3. ex, Jd лж 
晰 的 语义 模型 。 BOE TK ЕЛДАР ee L 63 AE HR X, Fe, Java В А Таха Ж 
5 (Java Monitor) [ЗАРАА ЖЕ, СВРТЕЛ ЕЛЯ ИНЫЕ: 实 
ЖІ, BAS OP EAS. ЯАВАЛ, Pihreads п Ж Т-А 
ЖЕН ЖИ, Pihreads 互 斥 辕 被 用 来 实现 互 斥 。 素 件 变量 用 来 调 诬 对 兴 享 资源 的 访问 ， 例 如 在 一 
AES ART ERR, 
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13.6 ба: 基于 预 线程 化 的 并发 服务 器 


| NIESE TB. T dn fa (ERI (ri БШ ЖЫЗ CAE EROR EE АО ЕЛІН. A T d r EN 
көніл, ТЕЖЕП Н WU TETERA Cprethreading) Tk Rh JE E 

在 图 153.14 IPIE ERE REP. ЖИП Е ИЧЕ РЗД Т — УНЕО, ХЕЕЕ ЕЁ 
RU ЕГЕ POD EHE. ТИЛШИ. —THETPEECPTBS BT EE 
13.29 所 未 的 生产 者 -消费 者 模型 来 试图 降低 这 种 开销。 


© | | 
Í кей y 






图 |329 MARENI ER SS DOR REO 
Ий ы ANS HARE UAE RE H RR ЕК iE GE T. 


| Ir dE IB T ЕРИН M38. worker КЕШЕН. ЕНИЯЕЕНТФЖН ИЗНЕ Ж. 
НИНИН Hed ЖЕН Е — ТУЗА ЗВ h, - мит ЕВЕ ИК Jo КРДЫН ik 
Ñ. ЖЕРИ, ЖЕЧИ ЕМ. 

图 1330 显示 了 我 们 怎样 用 Shr 外 来 实现 一 个 预 线程 化 的 并 发 echo НМ. НЕТ 
区 sbuf (9322 1T) 后 ,主线 程 创 建 了 一 组 worker ЕЕ CR 28226 T), ЕЕ АТЕНЕ 
MER, ЕЗЕНЕЖ. ИЯИИЕЕНШНЕРНИАЛ ДЕЕ с suf th. BP worker 量程 的 行为 者 
TERR. Z WH N Pl ibu ЕРЕ T PLE IE GERE C38 10. ЖЕНИ echo. car ЕН 
回 送 客 户 端的 输 六 ， 





 Cmle/roncrechoserveri_pre c 
] include "csapp.h" 
w. Winclude "sbuf.h*' 
3 "dofine NTHREADS 4 
ü Fdefine SBUFSIZE 15 
5 
Б void echo. cnt(iat соппҒай; 
7 void *thread(void 'vargmp; 
4 
9 ніні t abaf; /"shared buffer of connected descriptors */ 
10 
11 іш main(int ағас, char wwarqv) 


12 
13 
14 
15 
16 
17 
18 
19 
49 
AL 
22 
23 
ác 
25 
25 
27 
ZB 
28 
36 
31 
32 
33 
34 
35 
36 
37 
3% 
39 
ай 
41 
42 





并 发 编程 #63 


int i, listenfd, соппій, port, clientlen-sizeofistruct sockaddr іп); 
struct sockaddr in clientaddr; 
pthread t tid; 


if (argc !- 2} 1 
fprintf(stderr, "usage: %5 «port»in', argv[0]): 
ехікій); 

| 

port = atollargv[1]); 

sbuf init(&sbuf, SBUFSIZE); 

listenfd = Open listenfd(port); 


for [1 = C; 1 < NTHREADS; i++) /* Create worker threads */ 
Pthread create[ktid, NULL, thread, NULL); 


while 1} í 


connid = Acceptilistenfd, [SA *) &clientaddr, &clientlen!; 
sbut insertí(&ksbuf, czonntdà): /*Insert connfd in buffer */ 


void *thread(void *vargp) 


l 
Pthread d3etachipthread3_seltfiy); 
while {1l} 1 
int сопа = shuf removetksbuf};  /* Remove connid from buffer */ 
echo cnt (iconnfd] : /* Service chemi */ 
Close[connfd!; 
) 
) 


code/conc/echoservert_pre,t 


13.30 一 个 预 线程 化 的 并 发 echo 服务 器 


这 个 服务 器 生出 的 是 有 一 -个 生产 者 和 名 个 消 旨 者 的 生产 者 -消费 者 模型 。 


ЖЖ echo, cnt (图 13.31) 是 图 12.21 中 前 echo RARO CR. 它 在 全 局 变量 byte. ent 中 记录 
了 从 所 有 和 客 局 站 接收 到 的 累计 字 节 数 。 





вілы. | b BR 


code/conc/echo cnt.c 
finclude "csapp.h" 


static int byte спі; #*byte counter */ 
Static sem t mutex;  /*andthe mutex that protects it */ 


Static void init echo cnt(void) 
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1 | 
h £em init(&mutéex, 0, 1): 
9 byte cnt = ü; 
10 
11 
12 моїй cho cnt [int conntfd) 
13 | 
14 LAE n; 
15 char buf [MAXLIHNE]; 
16 rio Е rio: 
17 static pthread once t once = PTHREAD ONCE. ІМІТ; 
15 
13 ӘЕнгсейай опсвікопсв, init echo rn]: 
20 Rio_readinitblgrio, connfd); 
21 while[in = Ria readlinebi&rio, buf, MAXLINME)]) l= 01 { 
22 РГ Бату ex |: 
23 byte cnt += п; 
24 printii"thread Wd received d [а total) bytea on Їй %й\п", 
48 (int] pthread selEËEl), n, byte cnr, connfd]; 
26 Vi&mutgx); 
27 Ніс writen|connfd, buf, п); 
28 | 
2% | 
codefconcyerhoa cnt.c 


81331 echo cnt: echo fi —T 8, esu se РНЕ ЗЕТЕ 
i Д ВНИИ ЕЗ ЧА ШК. DIE HORT ГЕННЕН КШ ЕЖЕ a — ME 
HoK. RTL. ШП ЖШШЕ. byte, ent 计数 器 和 mutex 48 S k. 1252 EET Shuf 
和 Rio ETAHI e Rk ERHERE EDU TIERE. S). 5k. FEE W REI, HE 
Г ВТА РЕ echo ent ARH. СЕНІ рїмтай once 函数 【第 1937) JEU Ted ТЕ ВЕ. 
iT UC 6s ДЕЕ РЕ ЫЕ ТИЕП MEER. Ж ЛЕШ Н R К] echo: ent ІЙ 
用 pthread_onee AA, Е ЖЕ {Ж ҮС ГИ A НОЦЕ. 

НЕН ЫЕ. echo ent НЕН Rio {ИЕ LO d, (第 20 dp. Musso А Pg 
{КЕНШ TX KIT. HO. 88 23-24 ТЧ ICE E уе enc 的 访问 是 被 严 和 下 操作 保护 的 ， 
Xi ЕТЕНШЕЯШӘОН/Е 

UO $33 BUT E EIER SD E ME — ER. Hip. ET EE IE ЖИД ПИ ЛЕНЕ Ж 
X Tn Uta dE CE — AFAR E, Ж 4 Щ4 worker HUS e Sdn. x 
PR RH CENE" e FATA ДН"). 84 UO 事件 【 “连接 请 求 到 夺 ” 
和 ti or REGE УГ" ға Mk (HR HE RET de ЧЛЕ А"), 同样 ,每 沾 worker 
"dar — 5 “ЖҰЛЫНҒАН”, "КОЖИ "MORE B АД”, 一 站 转换 1“ 取 
LI PEB"). 


并 发 编程 765 


13.7 其 他 并 发 性 问题 


你 可 能 已 经 注意 到 了 ， 一 旦 我 们 要 求 同 步 访问 共享 数据 ， 那 么 事情 就 变 得 更 如 复杂 了 。 启 今 为 
止 ， 我 们 已 经 看 到 了 关于 互 斥 和 生产 者 -消费 着 的 同步 化 技术 ， 但 这 仅仅 是 关上 一 角 。 同 步 化 是 非 
常 困难 的 ， 引 出 了 在 警 通 的 顺序 程序 中 不 会 出 现 的 问题 。 这 一 小 节 是 关于 你 在 马 井 发 程序 时 需要 注 
总 的 一 些 问题 的 概括 《 决 不 是 全 面 的 概括 )。 为 了 更 加 其 体 化 , 我 们 将 以 线程 的 形式 描述 我 们 的 讨论 。 
不 过 要 人 记 住 ， 这 疮 典型 问题 是 任何 尖 弄 的 并 发 流 操 作 共 时 资源 时 都 会 出 现 拘 。 


137.1 线程 安全 

当 我 们 用 线程 编写 程序 时 ， 我 们 必须 小 心地 编写 那些 具有 称 为 线程 实例 性 (thread safety) 属性 
的 孙 数 ， 一 个 函数 被 称 为 线程 安全 的 thread-safe)， 当 有 生 仅 当 被 名 个 并 发 线程 反复 地 调用 时 ， 它 会 
站 产生 正确 的 结果 。 如果 一 个 函数 不 是 线程 实 全 的 ， 我 们 束 说 它 是 线程 不 安全 的 【thread-unsafe ). 
我 们 能 够 定义 出 四 类 【有 相交 的 ) 线程 不 安全 国 数 ， 

第 1238: ЖЕРЕЗЖЕІНИК 

我 们 在 图 13.16 的 count 函数 中 就 已 经 过 到 了 这 样 的 问题 , 该 活 数 对 一 个 末 受 保护 的 全 局 计数 器 
变量 加 1。 将 这 类 线程 不 安全 国 数 变 成 线程 安全 的 ， 相 对 而 言 比 较 容 易 ， 利 用 像 吕 和 站 操作 这 样 的 
同步 操作 来 保护 共享 的 变量 。 这 个 方法 的 优点 是 在 调用 程序 中 不 需要 敌人 在 何 修改 ， 缺 点 是 同步 操作 
将 减 慢 程 序 的 执行 时 间 。 

42%: 保持 跨越 多 个 调用 的 状态 的 函数 


一 个 伪 隐 机 数 生成 器 是 这 类 线程 不 安全 应 数 的 简单 例子 。 请 参考 图 13.32 ТИАМИН ЕВ 
程序 包 。 


code/conc/rand.c 
1 unsigned int next - 1; 
2 
3 РЕ rand - return pseudo-random integer on 0..37767 */ 
4 int randí(í(void) 
2 d 
6 next = next*1103515245 + 12345; 
7 return (unsigned int!) (next/65536) $ 32768; 
3 ) 
9 
10  /* stand - set seed for rand() */ 
11 void srand(unsigned int seed) 
12 { 
13 next = seed; 
ld 
code/conc/rand.c 


图 13.32 —PEREEASSURTN ОН ЕЖЕН 40) 


rand ЖЕНА ЕЙ, АЗАТ А НЕ ЖЕСЕ ТОЯ ЕРІНЕ. АПИЙ srand 
^j rand 设置 了 一 个 种 子 后 , 我 们 反复 地 从 -个 单线 程 中 调用 mna, 我 们 能 够 预期 得 到 一 个 可 重复 的 
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随机 数字 让 列 。 然 而 ， 如 果 多 线程 调用 rand ЕШ, KEIRA BEIGE у. 

使 得 rand 函 数 为 线程 安全 的 惟一 方式 是 重 写 它 ， 使 得 它 不 再 使 用 仔 何 静态 数据 ， 取 而 代 之 邮 居 
靠 调用 者 在 参数 中 传递 状态 信息 。 这样 做 的 缺点 是 ， 程 译员 现在 还 要 被 迫 修 改 调用 程 译 中 鸭 代 码 。 
在 一 个 大 的 程序 中 ， 可 能 有 成 百 上 于 个 不 同 的 调用 位 置 ， 做 这 样 的 修改 将 是 非常 及 烦 的 ， 而 则 还 容 
多 出 铂 ，。 


第 3 Ж: Ж ШҮН ЕА РИНГЕ A 

3 Hc p СШ gethostbynameO 将 计算 结果 放 在 静态 结构 中 , ER IRI THER IRE МЕ ІН НЕТ. 
WIB IU H AREE FEHLER К, ДАНТЕА ЕЖЕ. AA IEE T ACRAS za ЖЕЕ 
5 —^ £X EABTH RU Н í 

有 了 两 和 方法 来 处 理 这 类 线程 不 安全 前 数 。 НЕНЕН, ИННА НАН 
构 的 地 址 。 这 就 消除 了 所 有 共识 教 据 ， 但 是 它 要 求 程序 员 膛 要 虚 写 调用 者 中 的 代 雹 。 

如 果 线 程 不 安全 浮 数 是 难以 修改 或 不 中 能 修改 的 【例如 ,， 它 是 从 一 个 产 中 链接 过 来 的 )， 才 人 么 另 
外 -种 选择 就 是 使 用 我 们 称 为 lock-and-copy 《加 锁 - 拷 贝 ) 的 技术 。 这 个 概念 将 线程 不 安全 陋 数 与 旦 
斥 锁 腾 系 了 起 来 。 在 每 一 个 调用 位 置 ， 对 互 斥 锁 加 锁 ， 调 用 线程 不 安全 参数 ， 动 态 地 为 结果 分 配 行 
傅 器 ， 拷 贝 图 数 返 回 的 结果 到 这 个 存储 器 位 置 ， 然 后 对 下 斥 镇 解锁 一 个 豚 引 人 的 变化 是 定义 了 一 
个 线程 安全 的 包装 【wrapper) Ж, CHIT loek-and-copy， 然 后 通过 译 用 这 个 包装 函数 来 取代 所 有 
对 线程 不 安全 函数 的 调用 。 例 如 ， 图 13.33 给 出 了 一 个 gethostbyname 的 线程 安全 的 版 本 ， 利 用 的 就 
是 lock-and-copy 技术 。 


第 4 类 : АЖ A X ein S 

HRAS ГИН ЛТ ЖФ р. 闭 么 ff 就 是 线程 不 安全 的 妈 ? 不 EMA р 是 第 2 ЖЖ, 
即 依赖 于 跨越 多 次 调用 的 状态 ， 那 么 工 也 是 线程 不 安全 的 ， 而 有 除了 重 写 g Uih RATAA. 
AAT, ШЖ g 是 第 1 类 或 者 第 3 类 盟 数 ， 那 么 只 要 你 用 个 互 未 锁 保护 调用 位 置 和 任何 得 到 的 共 量 
数据 ,『 可 能 仍然 是 线程 安全 的 ,在 图 13.33 中 我 们 看 到 了 一 个 这 种 情况 很 好 的 示例 ， 其 中 我 们 使 用 
lock-and-copy AST ЕНА К, БН Г АЛ Ы. 
Too M co0de/conc/pethosthyname_ts.c 


struct hostent *gethostbyname ts(char *hostname) 
| 


struct hostent *sharedp, *unsharecdp; 


unsnaredp = Mallocisizeofístruct hostent))J; 
Pi&mutax); 
charedp = gethostbynameinostname!;: 


*unsharedp = *sharedp: /* сору shared struct to private struct */ 
Vi&mutex!-: 


9 return unsharedp; 
1 


—] c» ап È L. г БЕ 


Е =e unm сї) 


code/canc/gethostbyname ts.c 
81333 gethostbyname ts: gethostbyname 的 一 个 线程 安全 的 包装 函数 
合用 lock-and-copy 搞 术 调用 一 个 第 2 类 线程 不 安全 函数 。 
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137.2 可 重 入 性 

Баара, MATEA At (reentrant function)， 其 特点 在 于 它们 具有 这 样 
一 种 属性 ， 妆 它们 被 多 个 线程 调用 时 ， 不 会 引用 性 柯 共 享 数 据 。 

尽管 线程 安全 和 可 重 入 有 时 会 《不下 确 地 》 被 用 做 同 兰 合 ， 但 是 和 它们 之 间 还 是 有 痕 晰 内 技术 到 
别 ， 值 得 留意 。 图 1334 展示 了 可 重信 函数 、 线 程 安全 函 煞 和 线程 不 安全 图 煞 之 间 的 集合 关系 。 所 
有 蔷 数 的 集合 被 划分 成 不 相交 的 线程 安全 和 线程 不 安全 隐 数 集合 。 可 重 入 函数 集合 是 线程 安全 前 数 
的 -个 真子 集 。 





13.34 可 重信 函数 、 线 程 安全 函数 和 线程 不 安全 函数 之 间 的 集合 关系 


可 重 入 函数 通常 要 比 不 可 重 入 的 线程 安全 的 函数 高 效 一些 ， 因 为 它们 不 需要 同步 操作 。 更 进 一 
步 来 说 ,将 第 2 类 线程 不 安全 前 数 转 化 为 线程 安全 函数 的 惟 - -方法 就 是 重 写 它 , 使 之 变 为 可 重 入 的 。 
plar, B 13.35 展示 了 图 13.32 中 rand 函数 的 一 个 可 重 入 的 版 本 。 关 键 思 路 是 我 们 用 一 个 调用 者 传 
说 进来 的 指针 取代 了 静态 的 next 变量 。 


code/conc/rand r.c 
/* rand, r - a reentrant pseudo-random integer on 0.32767 */ 
int rand r(unsigned int *nextp) 
1 
*nextp = *nextp % 1103515245 + 12345: 
return [unsigned int)i*nextp / 55536) $ 32758; 


Cy iP b i w ғы 


code/conc/rand r.c 
13.35 rand r: & 13.32 ri rand к аА 


检查 某 个 图 数 的 代码 并 先 验 地 断定 它 是 可 重 入 的 ， 这 可 能 四 ? 不 幸 地 是 ， 不 一 定 能 这 样 。 如 果 
所 有 的 霄 数 参 数 都 是 传 值 传递 的 《也 就 是 ， 没 有 指针 )， 并 且 所 有 的 数据 引用 都 是 本 地 的 自动 栈 变量 
‘也 号 是 ， 没 有 引用 静态 或 全 局 变 景 )， 那 么 疯 数 就 是 显 式 可 重 入 的 《explicitly reentrant), CRE 
说 ， 尤 沦 它 是 被 如 何 调用 的 ， 我 们 部 可 以 断 吉 它 是 可 重 入 的 。 

然而 ， 如 昌 把 我 们 的 概 设 放 寅 和 松 - -点 ， 允 许 显 式 可 重 入 函数 中 一 些 参数 是 引用 司 递 的 (也 就 是 
如 ,我 们 允许 尼 们 传递 指针 )， 那 么 我 们 就 得 到 了 一 个 隐 式 可 重 入 的 【implicitly reentrant) ра, E 
就 是 说 ， 在 调用 线程 小 心地 传递 指向 非 共享 数据 的 指针 时 ， 它 才 是 可 重 入 的 。 例 如 ， 图 13.35 中 的 
rand г СЕ Ваз oT Ж A ВЧ. 

我 们 总 是 使 用 术语 可 重 入 (reentrant) ЕЕ ЕА В АТА ра, ЖИ. AUR 
到 可 重 入 性 有 时 同时 是 调用 者 和 被 调用 者 的 属性 ， 并 不 只 是 被 调用 者 单独 的 属性 ， 是 非常 重要 的 。 
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图 1333 ТҮ gethostbyname ts did TUI BRAT жан, КҮТҮҮ 


13.7.3 在 多 线程 程序 中 司 用 已 存在 的 库 函 数 
KER Unix Ше ЖЕЛ C Beri ВРА k (JOU malloc. free. nealloc. printf 和 scanf) 者 
是 线程 安全 的 ， 内 有 一 小 部 分 是 和 出外。 图 1336 ЖШТ ЖШ. C#36081J6 El IR — T SERE 


$9.) 
SETT ай иней Unix ЖЕЕ 





rand І rand т 

atgrak ? Btrtok r 

TRECE {Жей 3 ангтіне Т 

сілте 1 crime r 

gat hostbyaddr 1 gëtbsatbhyaddr т 
| gethoztbnrname 3 gethosgkbyrnane r 
| inet ntoa 3 Fa 

localtime 3 localtire r 





mi WINBARHTETIERE 


asctime. ctime 和 localtime Bš ELRE GET E] R] RE E RR 5 [E] HT [B $e hala Ж ЧЕЛ 6 m. 
gethostbyname, gethosibyaddr 和 inet ntoa 函数 是 我 们 在 第 12 E AENT. ЖЕНЕНИН 
KE. sunok КЕШЕ ТИ (WHETER ИЖЕ НЕЙ. 

除了 rand 和 striok 11%, ЖАНЕ ЕЕЕ АШ ЕЙ 3 A6. cc II НШІ 
的 指针 .如 时 我 们 需要 在 一 个 雪线 程 程序 中 调用 这 些 函 数 中 的 某 一 个 ， 最 简单 的 方法 是 
Ipck-and-copy . lock-and-copy 的 缺点 是 町 外 的 同步 降 佐 了 屋 序 的 速度 。 更 进一步 , АНТЫН rand 
AL FECE EE UN FH 9 s 3 n 0o OR 8 ЯН. ШЖ. Unix ES K paki k АШ 
BRANE ПЖ МЖӨ S IRE “т” SERE. МШ, gethostbyname 的 可 重信 版 本 就 电 
W pethostbyname_r, 不幸 的 是 ， 基 于 Unix Ha] Es LL BE. JE ELE Unir Ж F 
TEC. DRE. RIS SSO hH ПП. 


1374 ЯЗ 

Z— T RUFINIEMTERBLT — MAREEA- TARRE y A ЗАЕС f rh RT x ЕТ, 
HERLEES (гасе), ЖЖ ЗЕ И ДЫ АГИ ТЕШ Bt МЕ ИНЕ ИЕНЕН n fH SE BUT AC ds 
m mil mmm. ФИННРОЯИМНН ГТ ИНА ЕЙ ТЕ. 

园子 是 理解 竟 争 本 质 的 最 简单 的 证 法。 让 我 们 来 看 看 图 13.37 中 的 简单 程序 。 主 线程 创建 了 四 
TASE. FER- TEA- HEC О: С ID 的 指针 到 每 个 线程 。 短 个 对 等 线程 持 贝 它 的 参 败 
НЕЗ ID 到 一 个 局 部 变量 中 《第 21 8s RERE Pa di ID 的 信息 ， 
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code/conc/race.c 


1 tinclude "csapp.h" 

2 #define N š 

3 

4 void *thread(void %уағар); 

5 

6 int maini} 

7 і 

8 pthread t tid[N]; 

9 int 1; 

10 

11 for {1 = (G; 1 < N; i++} 

12 Pthread create(&tid[il, NULL, thread, &1); 
12 for {1 = Ü; i < NH: i++} 

14 Pthread_join(tid[i], NULL); 
15 ехік(0): 

16 ] 

17 


18  /*thread routine */ 
19 void *thread(void *vargp) 


20 f 

21 int myid = *((int *)vargn); 

22 printf("'Hello from thread €din", myid); 
23 return NULL; 

24 ] 


code/conc/race.c 


图 13.37 ”一 个 带 竞争 的 程序 
尼 看 上 去 足 由 简单， 但 是 当 我 们 在 系统 上 运行 这 个 程序 时 ， 我 们 得 到 以 下 不 正确 的 结果 ， 


Jnix» ./race 

Hello from thread 1 
Helio from thread 3 
Hello from thread 2 
Hello from thread 3 


问题 是 由 每 个 对 等 线程 和 主线 程 之 间 的 竟 争 引起 的 。 你 能 发 现 这 个 竞争 吗 ? 下 面 是 发 生 的 情况 ， 
当主 线程 在 第 12 行 俩 建 了 一 个 对 等 线程 ， 它 传递 了 一 个 指向 本 她 栈 变 量 i 的 指针 。 在 此 时 ， 竞 争 出 
现在 下 一 次 在 第 12 118 FH pthread. create 和 第 21 行 参数 的 间接 引用 和 赋值 之 间 。 如 果 对 等 线程 在 主 
线程 执行 第 12 行 之 前 就 执行 了 第 21 行 ， 那 么 myid 变量 就 得 到 正确 前 ID。 否 则 ， 它 就 包含 的 是 其 
已 线程 的 ID。 令 人 惊慌 的 是 ， 我们 是 否 得 到 正确 的 等 案 依 闲 于 内 核 是 如 何谓 度 线 程 的 执行 的 。 在 我 
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ПНЕ ЕКІ. BIEN. ГАЕТЕ ТОЙ, LERA “ЖИЕ” ЕКА 
序 的 严重 异 误 . 

为 了 清除 党 争 ， 我 们 可 以 动态 地 为 每 个 整数 ID AE- h BOR, MEHR EE + 
指向 这 个 热 的 指针 ， 加 用 13.38 所 示 [第 12 一 14 1». ИНЕВНЕНЕОЯНИЦЫОЕНЫ ІШ 
Ba. 

汝 我 们 在 系统 上 运行 这 个 程序 时 ， 我 们 现在 得 到 了 正确 的 嬉 果 ; 


unix» ./поғасе 

Hello fram thread D 
Hello from thread 1 
Hello from thread 2 


Hallo from thread 3 


Ў 58 13.8 
在 图 13.28 Ф, 我 们 可 能 据 要 在 主线 程 中 的 和 Ure x АҒАЖАН 
xd baikku. PA ka tiak. ЯНА? 


КЗ 1310 

A. ЖШ 1338 p. Аня OR ID РЕ asyik ERES, hok — TUAM 
malo АЯ free & E e TE) ЖЕ, 

B. i| x kha M 4 r 7 





codelcane/nerace.c 
| 4include 'csapp.h" 
2 ШеГілпе H d 
3 
4 void *rhread|vold *vargp): 
3 
6 int maini] 
1 | 
B pthread t tid[N]; 
8 ink i, "рет; 
1D 
11 Eór [i = D; 1 < Ny ї++] { 
12 ptr = Malloc(sizeoflintl); 
13 "рк = і; 
14 Pechrea3_creatae(kridlil, NULL, thread, ptr]: 
15 ] 


16 For (à = Ü: i < H: iss] 
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1? Pthread join(tid[i], МЛ); 
18 exit (й); 
i29 } 
20 
al Æ thread routine */ 
22 void *threadivoid *vargp) 
23 f 
24 int myid = *(iint *jvardp!; 
25 Free [чагорі; 
26 printfí"Hello from thread %dxn", myid); 
27 re-urn NULL; 
ad] 
code/conc/norace.c 
13.38. W 13.37 中 程序 的 一 个 没有 竞争 的 正确 版 本 
137.5 Ж 


{тж А ТТЕ SAREE, ШІН (deadlock), EIERE ДЫ 
Не), 519 — АН АЈА. HERAT EE АКТ. РШ. Ea 13.39 
Жл Т ЖШ МЕБИЖ ЕНЕ ТЕНЕ Е. ЖӘНЕ, БЛПЕВНЕН-ЕАРЯЯШМ 
重要 知识 : 

* FTH PA V ЖЕЛИНЕ 3, UERN SENAN (forbidden region? ##. 
ЭЖ R: BUT S ТАЛАА ТА 那么 就 不 可 能 有 进一步 的 进展 了 , АЛЕ 
止 区 域 组 塞 了 每 个 合法 方 避 上 的 进度 。 换 名 话说， 程序 死 锁 是 因为 每 个 线程 都 在 等 待 其 他 
线程 执行 - -个 根 不 可 能 发 生 的 本 操作 ， 

« PANA От р Ж U 3348 К (deadlock regin) 的 状态 。 如 果 - :个 轴线 偶然 到 
达 了 ТУРДА, ЯА Е Лау. НЕЛИНА, (НА 
它们 不 可 能 离开。 

€ 死 锁 是 -个 相当 局 难 的 问题 ， 因 为 它 不 总 是 可 预测 的 。- : 些 幸 运 的 执行 轨 线 将 绕 开 死 
馈 区 域 , 而 其 他 的 将 会 陷入 这 个 区 域 ,。 图 13.39 展示 了 每 种 情况 的 个 示例 。 对 于 程序 
中 来 说 ,这 其 中 隐 含 的 着 实 令 人 棕 懂 。 你 可 以 1000 次 运行 一 个 程序 不 出 任何 问题 ， 但 
是 下 一 砍 它 就 有 可 能 会 沦 驶 。 避 痢 程序 在 一 台 机 器 上 可 能 运行 得 很 好 ， 但 是 在 男 外 的 

机 器 上 就 会 死 锁 。 最 糟糕 的 是 ， 错 澡 常 常 是 不 可 重复 的 ， 因 为 不 同 的 执行 有 不 同 的 轨 
H. 

程序 死 锁 有 很 多 原因 ， 要 避免 死 锁 一 般 而 言 是 很 困难 的 。 然 而 ， 当 使 用 二 进 制 信号 量 来 实现 互 
EE ЯВ 13.39 所 示 ， 你 可 以 应 用 下 面 的 简单 而 有 效 的 规则 来 避免 死 锁 ; 

БАМ АА. 如 果 对 于 程序 中 每 对 互 斥 锁 (5, D. PARES s 也 包含 上 的 线程 都 按 
照相 同 的 嘎 序 同时 对 它们 加 锁 ， 那 么 这 个 程 证 就 是 无 死 锁 的 。 

例如 ， 我 们 可 以 通过 这 样 的 方法 来 解雇 图 13.39 中 的 死 锁 问题 ， 在 每 个 线程 中 先 对 $ ІН, Ж 
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81340 一 个 无 死 锁 程 序 的 进度 图 


ЕХ 13.11 
Ж#Н, БАЮ ЕАК, 
Wt: ва]. t0. 
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线程 1; AU 2, 

P (s); P (6); 

y {57 V (s); 

P (1) Pít) 

V (t): V (t); 

А, Bub ER VERB. 

B. '£ Sot SECUS? 

C. dXX. Z 33545 EEA А М 309 E Sk bu CREER S ЖУЫ? 
D. ЖЖ £e AUREUS SER IS 


13.8 小结 


“个 并 发 程序 是 由 在 时 间 上 重 登 的 一 组 逻辑 流 组 成 的 。 在 这 一 章 中 ， 我 们 学 习 了 三 种 不 同 的 榴 
建 并 发 程序 的 机 制 ， 进程 、UO 多 路 复 用 和 线程 。 我 们 以 一 个 并 发 网 络 服务 器 作为 员 军 全 章 的 应 用 
程序 ， 

进程 十 由 内 核 日 动 调度 的 ， 而 且 因 为 它们 有 各 上 自 独 立 的 虚 按 地 址 笃 间 ， 所 以 要 实现 共 学 数据 ， 
它们 需要 显 式 的 PC 机 制 。 事 忻 驱 动 程序 创 建 它们 目 己 的 并 发 逻 辑 流 ， 这 包 逻 辑 流 被 模型 化 为 状态 
8, ШОО 多 路 复 用 来 显 式 地 调度 这 些 流 。 因 为 程序 运行 存 - TRE -进程 中 ， 所 以 在 流 之 间 共 至 数 
ЖАНЫП КЕ. НЕЕ та, 同 基于 进程 的 流 -- 样 ,线程 是 由 内 核 自 动 调度 的 。 
HÆF IO 多 路 复 用 的 流 一 样 ， 线 程 是 运行 在 -个 单一 进程 的 上 下 文中 的 ， 因 此 可 以 快速 而 方便 地 
зк ін. 

БЕ, ЛА СЕ hj AH AREARE. ЗЕЕ S BU P # У 
澡 作 惑 是 为 了 帮助 解决 这 个 问题 。 信 和 号 量 操作 可 以 用 来 提供 对 共享 数据 的 互 斥 访 问 ， 也 对 诸如 生产 
者 -消费 者 程序 中 共享 退 冲 区 这 样 的 资源 访问 进行 调度 。 一 个 并 发 预 线 程 化 的 echo 服务 器 提供 了 这 
丙种 信号 量 使 用 场景 的 很 好 的 例子 。 

ЕА Г 些 困 难 的 问题 。 被 线程 调用 的 函数 必须 具有 一 种 称 为 线程 安全 的 属性 。 
我 们 定义 了 权 类 线程 不 安全 函数 ， 以 及 一 些 将 它们 变 为 线程 安全 的 建议 。 可 重 入 函数 是 线程 安全 
了 盘 数 的 -个 真子 集 ， 它 不 访问 任何 共享 数据 。 可 重 入 函数 通常 比 不 可 重 入 函数 更 为 有 效 ， 因 为 它 
们 不 再 赛 任 何 问 步 原 语 。 竞 争 和 死 镇 是 并 发 程序 中 出 现 的 另 一 些 困难 的 问题 。 当 程序 员 错 误 地 假 
设 逻 辑 流 该 寻 何 调度 时 ， 就 会 发 生 竞争 。 当 一 个 流 等 待 一 个 永远 不 会 发 生 的 事件 时 ， 就 会 产生 死 
йй. 


参考 文献 说 阴 

信和 与 量 操 作 是 Dijkstra 提出 的 [24]。 进 度 图 的 概念 是 Coffmanf16] 提 出 的 ， 后 来 由 Carson. 和 
Reynolds[10] 正 式 化 的 。Butenhof 的 书 [9] 对 Posix 线程 接口 有 全 面 的 描述 。Birrell[4] 的 文章 对 线程 纺 
程 以 及 线程 编程 中 容易 遇 到 的 问题 做 了 很 好 前 介绍 。Pugh 描述 了 Java 线程 通过 存储 器 进行 交 卫 的 
方式 的 缺陷 ， 并 提出 了 替代 的 存储 器 模型 [61]。 
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13.12 % 

编写 - hellec (Ë] 13.13) КЖ, fr ed ER n НІ Cjoinable) 对 等 线程 ， 
其 中 是 一 个 命令 行 参数 ， 

13.13 % 

А. 图 13.41 中 的 程序 有 “个 bug。 票 求 线程 睡眠 一 秒 ， 然 后 输出 CFTR. Am. SERT 
的 系统 上 运行 它 时 ， 却 没有 任何 输出 ， 为 什么 ? 

B. 你 避 以 通过 用 两 个 不 同 的 Pthreads 函数 调用 中 的 一 个 普 代 第 9 行 中 的 exit ЕЖ, 来 收 正 这 个 
TA. ОАЕ? 

code/canc/hellobug.c 

Шілсішде "csapp.n" 


void *threadivcid *vargdp): 


l 

2 

3 

4 int maini] 

2 { 

5 prthread t tid; 
7 

B 

3 


Pthread create(&tid, NULL, thread, NULL); 
ехісій); 
10 } 


12 /* thread routine */ 


13 void *threadívoic *vargp) 


14 { 
15 51еер{1); 
15 printfi"Hello, world!in"); 
17 return NULL: 
18 1 
code/conc/hellobug.c 
图 13.41 习题 13.13 的 有 bug 的 程序 
13.14 %Ф% 


恰 合 一 下 你 对 select 函数 的 理解 ， 请 收 改 图 13.6 中 的 服务 器 ， 使 得 它 每 次 在 主 服 务 器 循环 中 最 
多 只 回 送 一 个 文本 行 。 
1315 %% 


图 13.8 中 的 事件 驱动 并 发 echo 服务 器 是 有 缺陷 的 ， 因 为 一 个 恶意 的 客户 端 能 够 通过 发 送 部 分 
的 文本 行 ， 使 服务 器 拒绝 为 其 他 客户 端 服务 。 编 写 一 个 改进 的 服务 器 版 本 ， 使 之 能 够 非 阻塞 地 处 理 
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这 些 部 分 文本 行 。 
13.16 % 
Rio VO Жы iC (440) 都 昆 线程 安全 的 。 它 们 也 都 是 可 重 入 国 数 吗 ? 
13.17 % 


(ЖЕ 13.30 中 的 预 线程 化 的 并 发 echo 服务 器 中 ， 每 个 线程 都 调用 echo cnt 函数 【图 13.13). 
echo, cnt 是 线程 安全 的 吗 ? 它 是 可 重 入 的 吗 ? АРА Eft ATE? 

1318 %% 

—HÉ Bg £i d POL EE АНЫ FII HORE Б ЕНТ. RURJ USA V BE. EEA RR 
СЕНЕ ЧИА Е, HOPES AEVO КА, ЖУ: 


FILE *-pir, *fpout: 


Еріп = fdcpenisocktfd,"r"!); 

tpout = fdopení(sockfid,"w"]; 

AURA АН Р! mA EZ. E FAK HA T: 

fcloseifpin); 

fclose[fpout); 

然而 ， 如 时 你 试图 在 基于 线程 的 并 发 服务 器 上 党 试 这 种 方式 ， 你 将 制造 一 个 致命 的 竞争 条 件 。 
请 解释。 

13.14 € 


在 图 1340 中 ， 将 两 个 了 操作 的 顺序 变换 ， 对 程序 死 锁 是 否 有 影响 》 通 过 男 出 四 种 可 能 情况 的 
进度 图 来 证 明 你 的 答案 ; 





13.20 % 
КЕМЕЛ? 为 什么 ? 


Initially:a = 1, p = 1, c = 1, 


Thread 1: Thread 2; 
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Pla); Piel; 

Fib); Pib}: 

Vib); V ib) 

Pic); Vich: 

Vic]; 

Vla); 

1321 % 
考虑 下 面 这 个 会 死 锁 的 程序 段 ， 


Initially:a = 1, b = 1, ë = 1. 


Thread 1: Thread 2: Thread 3 
Pla); P(c); Рс); 
РІ»); Рв); Vic); 
V (b); V ib); PD); 
Р{С}; Vic); Р(а}; 
міс); Pia}; Vial; 
Уа); Vla); V (b): 


A.， 列 出 每 个 线程 同时 保持 的 一 对 互 斥 锁 。 
B. ЖЖ a<b<c， 那 么 哪个 线程 违背 了 互 斥 锁 加 锁 顺 序 规 则 ? 
C. 对 于 这 些 线程 ， 指 出 一 个 新 的 保证 不 会 发 生死 锁 的 加 锁 顺 序 。 


1322 ФФ% 

实现 标准 的 11O 函数 fgets 的 一 个 版 本 , 叫做 tfgets, 假如 它 在 5 秒 之 内 没有 从 标准 输入 上 接收 到 
一 个 输入 行 ， 那 么 就 超时 ， 并 运 回 一 个 NULL 指针 。 你 的 函数 应 该 实现 在 一 个 叫做 tfgets-select.c 的 
包 中 ， 使 用 进程 、 信 号 和 非 本 地 跳 转 。 它 不 应 该 使 用 Unix 的 alarm ЖЖ. НІҢ 13.42 中 的 驱动 程 
序 测 试 你 的 结果 。 


13.23 %Ф%% 

使 用 select 肖 数 来 实现 练习 题 1322 中 tfgets 责 数 的 一 个 版 本 ， 你 的 函数 应 该 在 一 个 叫做 
tfgets-selec.c 的 包 中 实现 。 用 练习 题 1322 中 的 驱动 程序 测试 你 的 结果 。 你 可 以 假定 标准 输入 被 赋 
HAREE, 


1324 ФФ% 
实现 练习 题 13.22 中 dges 函数 的 一 个 名 线程 版 本 。 你 的 函数 应 该 在 一 个 叫做 fgets-selecte 的 
包 中 实现 ,用 练习 题 13.22 中 的 驱动 程序 测试 你 的 结果 。 


13.25 %Ф%% 
实现 一 个 基于 进程 的 Tiny Web 服务 器 的 并 发 版 本 。 你 的 解答 应 该 为 每 一 个 新 的 连接 请 求 创建 一 
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个 新 的 了 进程 。 司 用 一 个 实际 的 Web 浏览 器 来 测试 你 的 解答 。 


code/conc/tfgets-main.c 


m 


Rinclude "csapp.h" 


3 char *tfgetslcnar *s, int size, FILE *stream); 
4 
5 int main() 
5 { 
7 char buf([MAXLINE]; 
8 
9 if (tfgets(buf, MAXLINE, st3in) == NULL! 
10 printfí"SOOM!*n"); 
11 eise 
12 printfí"*s", buf); 
13 
14 exit(0); 
15 } 
code/canc/tfgets-main.c 
图 15.42 258 13.22-13.24 的 驱动 程序 
1326 %%% 


实现 一 个 基于 VO 多 路 复 用 的 Tiny Web 服务 器 的 并 发 版 本 。 使 用 一 个 实际 的 浏览 器 来 测试 你 的 
ЖЕ. 
1327 %%% 


实现 一 个 基于 线程 的 Tiny Web 服务 器 的 并 发 版 本 ,你 的 解答 应 该 为 每 一 个 新 的 连接 请 求 创建 一 
个 新 的 线程 。 使 用 一 个 实际 的 浏览 器 来 测试 你 的 解 管 。 


13,29 99699 
实现 一 个 Tiny Web НАНЫНЫҢ Ж. МЕН ЕМ НА. 动态 地 增加 


或 减少 线程 的 数目 。 一 个 策略 是 当 缓 神 区 变 满 时 ， 将 线程 数量 翻 倍 ， 而 当 缓 冲 区 变 为 空 时 ， 将 线程 
数 上 日 减 半 。 使 用 一 个 实际 的 浏览 器 来 测试 你 的 解答 ， 


1320 ФФФ9% 

Web 代理 万 一 个 在 Web 服务 器 和 训 览 器 之 间 扮演 中 间 角 色 的 程序 。 浏览 器 不 是 直接 连接 服务 器 
以 获取 网 页 ， 而 是 与 代理 连接 ， 代 理 再 将 请 求 转发 给 服务 器 。 当 服务 器 响应 代理 时 ， 代 理 将 响应 发 
送 给 浏览 器 。 实 现 这 个 试验 ， 请 你 编写 -- 个 简单 的 可 以 过 滤 和 记录 请 求 的 Web 代理 : 

А. 试验 的 第 一 部 分 中 ， 你 要 建立 以 搂 收 请 求 的 代理 ， 分 析 HTTP， 转 发 请 求 给 服务 器 ， 并 且 返 
HERAN. 你 的 代理 将 所 有 请 求 的 URL 记录 在 磁盘 上 一 个 日 志文 件 中 , 同时 它 还 要 阻塞 所 有 
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对 包 人 省 人 在 磁 盘 上 一 个 过 涉 文 件 中 的 URL 的 请 求 。 

B. ЕР Aor ЕЛЕНА, 它 通过 派生 一 个 独立 的 线程 来 处 理 每 一 个 请 求 ， 合 
得 你 的 代理 能 够 一 次 处 理 名 个 打开 的 连接 。 当 你 的 代理 在 等 待 远程 服务 器 响应 一 个 请 求 使 它 能 服务 
于 -个 浏览 器 了 时， 它 应 该 可 以 处 理 来 自 另 一 个 浏览 器 未 完成 的 请 求 。 

使 用 一 个 实际 的 浏览 器 来 检验 你 的 解答 。 


练习 题 党 案 


练习 题 13.1 答案 

当 父 并 程 派生 于 进程 时 ， 它 得 到 一 个 已 连接 描述 符 的 副本 ， 并 将 相关 文 忻 表 中 的 引用 计数 从 1 
增加 到 2。 当 父 进程 关闭 它 的 描述 符 副 本 时 , 引用 计数 就 从 2 减少 到 1, 因为 内 核 不 会 关闭 一 个 文件 ， 
月 到 文件 表 中 它 的 引用 计数 值 变 为 零 ， 所 以 子 进程 这 边 的 连接 端 将 保持 打开 。 


练习 题 13.2 答案 
当 : 一 个 进程 因为 某 种 源 因 终止 时 ， 内 核 将 关闭 所 有 打开 的 描述 符 。 内 此 ， 当 子 进程 退出 时 ， 它 
的 连接 文件 描述 符 的 副本 也 将 被 自动 关闭 。 


练习 题 13.3 "E 

回想 一 下 ， 如 果 一 个 从 描述 符 中 读 -个 字 节 的 请 求 不 会 阻塞 ， 那 么 这 个 描述 符 就 准备 好 可 以 读 
T.: {КЖ EOF 硅 一 个 描述 符 上 为 真 ， 那 么 描述 符 也 准备 好 可 读 了 ， 拉 为 读 操 作 将 立即 返回 一 个 零 返 
РІШ, Жж EOF. КП, $A ctrl-d 会 导致 select 函数 返回 ， 准 备 好 的 集合 中 有 描述 符 О. 


练习 题 13.4 答案 
四 为 变量 pool.read_set 既 作 为 输入 参数 也 作为 输出 参数 ， 所 以 我 们 在 每 次 调用 select 之 前 部 
重 痢 初始 化 它 。 在 输入 时 ， 它 包含 读 集 合 。 在 输出 ， 它 包含 准备 好 的 集合 。 


练习 题 13.5 答案 

因为 线程 运行 在 同一 个 进程 中 ， 它 们 都 共享 相同 的 描述 符 表 。 励 论 有 多 少 线程 使 用 这 个 已 连接 
描述 符 ， 这 个 已 连接 推 述 符 的 文件 表 的 引用 计数 都 等 于 一 。 因 此 ， 当 我 们 用 完 它 时 ， 一 个 close $ 
作 就 足以 释放 与 这 个 已 连接 描述 符 相 关 的 存储 器 资源 了 。 


练习 题 13.6 答案 
这 日 的 十 要 的 意思 是 说 ， 当 共享 全 局 和 静态 变量 时 ， 静 态 变量 是 私有 的 。 诸 如 cm 这 样 的 静态 
变量 有 点 小 朵 烦 ， 因 为 共享 是 限制 在 它们 的 函 教 范围 内 药 一 一 在 这 个 例子 中 ， 就 是 线程 例 程 。 
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ә ptr: -个 被 主线 程 写 和 被 对 等 线程 读 的 全 局 变量 。 

* cnt: 一 个 静态 变量 ， 被 两 个 对 等 线程 读 和 写 ， 在 存储 器 中 只 有 -个 实例 ， 

• Lm: -- 个 存储 在 主线 程 找 中 的 本 地 自动 变量 。 员 然 它 的 值 被 传递 给 对 等 线程 ， 但 是 对 等 线 
程 也 决 不 会 在 栈 中 引用 它 ， 因 此 它 不 是 共享 的 。 

• msgem: 一 个 存 依 在 主线 程 栈 中 的 本 地 自动 变量 ， 被 两 个 对 等 线程 通过 ptr 间接 地 引用 ， 

. myid.) 和 myid.1: 分 别 驻 留 在 对 等 线程 0 和 线程 在 的 本 中 的 一 个 本 地 自动 变量 的 实例 。 

B. 变量 ptr. cn 和 msgs 被 多 于 一 个 线程 引用 ， 因 此 它们 是 共享 的 。 


练习 是 13.7 答案 
这 旱 的 重要 思想 是 ， 你 不 能 假设 当 内 核 调度 你 的 线程 对， 会 如 何 选择 顺序 。 





变量 ent 最 终 有 -一 个 不 正确 的 值 一 一 1， 


练习 题 13.8 ЖЖ 
gethostbyname ts 峭 数 不 是 可 重 入 函数 ， 因 为 每 次 调用 都 共享 相同 的 由 gethostbyname ІНІҢ 
的 static 变量 。 然 而 ， 它 是 线程 安全 的 ， 因 为 对 共享 变量 的 访问 是 被 P 和 VV 操作 保护 的 ， 因 此 是 互 
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EM. 


HH 13.9 ЕЖ 

和 如果 在 第 15 行 调 用 了 prhread create Es, ЖПУШНИН, ЛЕА ПИР ТВОЕ, 
ИРНЕ ТЕ EHR free 的 调用 和 厂 程 出 程 中 第 25 行 的 赋值 语句 之 问 。 

SIE 13.10 ЖЖ 

A, Е ЕНЕ Т, niei — EE ІШІН: 

For [i = D: 1«Н:1ғж| 

Pthread createi&tid[i].NULL.thread, (void il] 

THRAETH, BEES mE SET ин ЖШ, HRERS туд. 

їп myid = [int) vargpr 

B， 优 点 是 它 通过 消除 对 malloc 和 free ЗИЯН, ВЕЕ ОВ. EE S RS. КЕЗЕН 
bd им 一 样 坟 。 即 恒 这 种 假设 对 于 所 有 的 现 亿 系 财 来 说 者 为 真 。， 但 是 它 对 于 那些 过 去 遗留 下 来 
НЕМЕНЕ ЕИҒАА 7. 

4 5H 13.11 ЖЖ 

А. ЕНЕ POE PE BL PE] 13.43 所 示 。 





图 1343 -ТектинттІЕН 
B. [EL X Ef ПТ АНЕ ЖЕЙ N КЕМИК ЖЕ, PrELX THERE IER Ж, 
С. ТИШЧЕ. WU RSS S hA Т 56 0. 
D. 正确 的 程序 的 进度 图 如 图 13.44 所 示 。 
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图 13.44 正确 的 无 死 锁 的 程序 的 进度 图 
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АЛ HCL 参考 手册 


在 第 4 章 中 ， 我 们 用 HCL (Hardware Control Language, ЊЕ Z2 ЖИНА ТАЯНА 
设计 的 控制 逻辑 部 分 ,HCL 具有 : 些 硬 件 描述 语言 的 属性 , 允许 用 户 描 述 布尔 阔 数 和 字 级 选择 操作 。 
男 一 方面 ， 它 缺乏 许多 存 真 正 的 HDL 中 能 找到 的 特性 ， 语 如 ， 声 明 寡 存 器 和 失 他 存储 元 素 的 方 活 ， 
循环 和 条 人 忻 构 造 ， 模 块 定 关 和 实 屿 化 的 能 力 ， 以 及 位 提取 和 搬入 操作 。 

HCL 实际 上 只 是 一 种 语 寺 ,用 于 生成 疾 定 格式 的 CC 代码 。HCL 文件 中 的 所有 块 定义 虱 由 程序 
HCL2C 《表示 “HCL to С”) ®® C 函数 。 然 后 再 编译 这 些 消 数 ， 与 实现 其 他 模拟 器 胃 数 的 库 似 
码 和 链接 ， 产 生 可 执行 模 氢 程序 ， 如 上 岁 所 水 : 


pipe-std.c 
pipe-std.hcl ——+  hcl2c 


EELEE TF р W 


tty.a 






nf But КП 28 


pipe tty 


这 张 图 展 小 的 文件 被 用 来 生成 流水 线 模拟 器 的 交 本 版 本 。 

可 以 直接 用 CC 米 描述 控制 迎 辑 的 行为 ， 而 不 必 写 HCL， 然 后 再 翻译 成 C。 使 用 HCL 的 优点 是 
我 们 吓 以 打消 晰 地 区 分 硬件 的 功能 和 模拟 器 的 内 部 工作 方式 。 

HCL Н ЖЇР ЖЛ bool (ERARO 信号 要 么 是 0 ЖАНТ 而 int 表示 “整数 ") 
信号 等 价 于 性 中 的 int 值 。 数据 类 型 int 用 于 表 估 所 有 的 多 位 信号 类 型 ， 例 如 ， 字 、 害 存 器 JP 和 指令 
代 个 。 当 转换 成 CC 时 ， 这 瑞 种 数据 类 型 都 表示 为 mt 数据 ， 只 不 过 beo 类 型 的 值 只 能 等 于 0 或 者 1, 


A11 信号 声明 

HCL 中 的 表达 式 以 引用 整数 或 者 布尔 类 型 的 命名 信号 。 信 号 名 必须 以 字母 (a~z Ш А-2) 
开头 ， 后 面 可 以 基 任 意 数量 的 字母 、 数 字 或 者 下 划 线 (_)。 信 号 名 是 大 小 写 敏 感 的 。HCL 布尔 和 束 
狐 表 达 坏 中 的 布尔 和 整数 信和 号 和 名 实际 上 就 是 C 表达 式 的 别名 ,信和 号 的 声明 也 定义 了 相关 的 CC 表达 式 。 
信号 声明 可 以 共有 如 下 形式 中 的 一 种 ; 

boolsig name C-expr' 

intsig name C-expr. 

这 里 ，C-expr 可 以 是 任意 的 C RAER, Ek f ЛЕК EUIS CO 或 者 换行 等 On) Mah, 
AU C 代码 时 ，HCL2C НҢ C 表达 式 替换 所 有 的 信号 名 。 
A.1.2 引号 引起 来 的 文本 

引号 引起 来 的 文本 提供 了 一 种 从 HCL2C 直接 传递 文本 到 生成 的 C 文件 的 机 制 。 可 以 用 它 来 揪 
AERE. include 语 人 各 ， 以 及 其 他 一 些 通 常 能 在 CC 文件 中 发 现 的 东西 。 通 用 格式 为 ， 

quote 'string' 


这 里 string 可 以 是 任何 不 包含 单 引号 C) 或 者 换行 符 Ол) 的 字符 串 。 
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A.1.3 表达 式 和 块 

月 两 种 闫 型 的 表达 式 ， 布 尔 表 达 式 和 辑 数 表达 式 ， 在 我 们 的 语法 描述 中 分 别称 为 hool-expr 和 
int-expr. 图 A,1 列 出 了 不 同 的 布尔 表达 式 类 型 ， 按 照 优 先 级 的 降序 排列 ， 同 一 组 (组 与 组 之 间 由 水 
ЗК ҮР) 内 的 操作 共有 相等 的 忧 先 级 。 可 以 用 括号 来 改变 普通 的 操作 符 优先 级 。 

最 高 级 是 第 数值 0 和 1， 世 及 命名 的 布尔 信和 号。 优先 级 低 一 级 的 是 以 整数 为 参数 但 是 得 到 布 水 
结果 的 宪 达 式 。 集 合成 员 关 系 浏 试 将 第 一 个 整数 表达 式 int-expr 的 值 与 组 成 集合 的 每 小 整数 表达 式 
的 从 {int-expri…,int-expty} 相 比较 ， 如 时 发 现 机 匹配 钓 值 ， 结 兴 为 1。 关 系 操作 符 比较 两 个 整数 表 达 
A, МААЙА, РДІ, SKREDE, FEQ 


命 省 的 布尔 信号 
ini-expr in Lint-expr int-expry, 7^ int-exprul ЖАЯА 
ini-expr, == ini-expro 
int-expry Iz ini-expra Si WN D 
інІ-елреі < int-expra p Y D 
ini-expr, <= int-expr: F T 3 px 
Ini-expr > int-expra 大 十 测试 
іні-ергі >= int-expr; 大 于 或 等 寺 测试 


lbool-expr 


bool-expr; && bool-exprs 





bool-expr, lbool-expr: 


НА) НСІ 布尔 表达 式 
这 些 表 达 式 求 值 为 0 或 者 1。 操 件 是 按 腿 优先 级 的 降序 排列 的 ， 每 -组 内 的 操作 具有 相等 的 优先 级 ， 

R A.1 中 简直 的 表 丰 式 是 由 局 用 布尔 连接 符 的 公式 组 成 前 《1! 表 未 Net， 太 康 表示 Апа, MIER 
Ог). 

只 有 三 和 和 类 型 的 整数 表达 式 ， 数字 、 伍 名 的 束 数 信号 和 情 襄 【case) ZAA. AFE HEH 
表示 法 书写 的 ， 可 以 为 负 。 命 名 的 整数 信和 对 悚 用 同 前 面 讲 过 的 一 样 的 命名 规则 ， 情 况 表 达 式 有 下 面 
的 一 般 形式 : 

[ 


bool-expr, : inrexpr, 
bonl-expr, : int-expr; 


bool-expr, : int-expr 
] 


表达 式 包含- -系列 情况 ， 每 种 情况 i 是 由 一 个 布尔 表达 式 bool-expr; 和 - ARERR int-expr, 
组 成 ， 出 普 表 明 是 否 沪 选 拌 这 种 情况 ， 而 后 者 是 村 于 这 种 情况 得 到 的 值 。 在 对 一 个 情况 表达 式 求 值 
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有 时， 布尔 表达 式 是 按 申 顺 序 被 求 值 的 。 一 旦 有 一 个 布尔 表达 式 得 到 1， 大 么 相应 的 整数 表达 式 的 值 
WE OL s skin ЖЫН. 如果 设 有 布尔 袁 达 陈 来 值 为 1， 那么 这 个 情 包 表达 江 榴 惜 屿 为 0 一 
个 好 的 编程 习惯 是 让 最 后 -个 布尔 表达 式 为 1!， 以 保证 全 少 有 一 个 路 配 的 情况 。 

HCL 表 忠 式 菩 用 训 定 义 组 合 运 辑 块 的 行为 。 坪 的 定义 有 以 下 形式 < 一 ; 

bool nate = bool-expr: 

іре name = йї-ехр!, 

这 蛙 ， 第 一 种 形式 定义 的 是 布 水 块 ， 而 第 二 种 定义 的 是 全 级 块 。 对 于 一 个 声明 为 以 name МА 
ЖЕ, HC12C 产生 一 个 函数 gen_name。 这 个 困 数 没有 参数 ， 而 它 返 同一 个 int 类 型 的 结果 。 
A.1.4 HCL 示例 

下 而 这 个 示例 给 出 了 一 个 完整 移 HCL 文件 ， 用 HCL2C 处 理 它 得 到 的 CC 代码 是 完全 日 包含 的 。 
可 以 筑 评 这 个 代 翅 ， 并 带 上 老 示 得 入 信号 的 前 信行 参数 运行 它 。 蝎 如 典型 的 情况 是 ，HCL 文件 只 定 
义 模拟 模型 的 控制 部 分 。 然 后 生成 出 来 的 忆 代码 被 编译 ， 并 与 其 他 代码 链接 ， 形 成 串 执 行 模拟 器 。 
ПЛЕ Т ИАА ГЕН HCL 的 一 个 具体 的 例子 ,该 电路 基 基 于 4.2.4 节 中 描述 的 MUX4 电 


路 的 ， 其 结构 如 下 ; 
51 
m” m à . 

D 

C 7| миха fH- Оша 

B 

A 
1 ЕҢ Simple example oF ап НСІ file. 
2 яғ This file сап be converted to C using hci2c, апа then compiled. 
3 
4 ** In this example, we will generate the MUX4 circuit shown in 
Š ## Section 4.2.4. It consists of a control block that generates 
6 ЕЕ bit-level signals sl and 50 from the input signal code, 
7 тғ and Lhen uses these signals tc control а 4-way muitlplexor 
8 ## with даға inputs А, B, С, and D. 
3 
10 Яғ This code is embedded in a € program that reads 
11 яғ the values of code, А, B, C, and D from the command line 
lZ ## anc then prints -he circuit output 
13 
14 яв Information that is inserted verbatim into the C file 
19 quote '*include «stdio.h»' 
le quote 'finclude «stdlib.hs' 
i! quote 'int code val, әй val, sl vwal;' 


quote 'char **data names;' 


Lr н 
uw B - 
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20 #4 Declarations of signals used in the НСІ, description and 
21 44 the corresponding C expressions. 

22  boolsig 80 “зд val' 

23  boolsig 51 "81 val' 

24  intsig code 'code val' 

25  intsig A 'atoiídata names[O0])' 

26  intsig B 'atoiidata,names[1])' 

27  intsig C 'atoi(data names[2]!' 

28  intsig D 'atoi(data names([3J]!*' 

29 

30 ## BCL descriptions of the logic blocks 

31 bool 51 = code in ( 2, 3 }; 

32 

33 bool 50 = code in f 1, 3 1}: 

34 

35 int Out4 = Í 

36 ізі && 152 
3% ! 号- 

38 81 && !'sÜ 
39 1 

40 1; 

41 

42 f$ More information inserted verbatim into the C code to 
43 ## compute the values and print the output 

44 quote 'int main(int агас, char *argv[]?) (' 

45 quote "даға names = argv+2; ' 

46 quote 'code val = atoi(argv[11);' 

47 quote 'sl_val = gen sl); ' 

48 quote "50 val = деп =50();' 

49 quote 'printfí('Out = tdin", gen Out4());' 

50 quote 'return 0;! 

51 quote 'J' 


ЛУЗЕ T + S S0 5151, 以 及 整数 信和 号 code, 作为 对 全 局 变量 s0_ val. sl ма 1 code val 
引用 的 羯 名 。 它 还 吉明 了 整数 信号 A. B. CHD, 2E, AFN C RIOT EL 1 SES 
BURR TA ЛУ Н] КЕ ЕЕ Ж әсі. 

名 字 为 8] КДЖ ШЕ X En F$! C ҖИ: 


int gen slí) 
{ 


п Ga m ug 
== 
c 
-— 


кесдіп ((coàe vel) == ¿Ill code val) == 3); 


] 


从 这 里 可 以 看 出 ,集合 成员 关系 测试 是 以 一 系列 的 比较 来 实现 的 ,每 次 对 信和 号 code 的 引用 都 被 
НК Т С 表达 式 code val, 
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注意 , 这 个 HCL 文件 第 23 行 上 声明 的 信号 si 与 第 31 行 上 声明 的 名 为 s1 的 块 之 间 没 有 家 接 的 


AA. 


“Е С ЖЕЛ, П КА S gen sl 的 函数 。 


НЛ а ОТА Kh Ark FAEK K: 


int mainíint астас, char *arcv[]) í 


j 


data names = argv+2; 

code val = atoilargv[1]); 

sl val = gen sl(); 

Әр val = gen, sU]: 

printfi"Out = $din". gen OuL4()); 
return Ü; 


CERR SICURA FH Ж реп 51. gen 50 ЛІ gen_Out4， 这 些 函 数 都 是 根据 块 定义 生成 的 。 我们 还 可 以 看 
di C 代码 必须 如 何 定义 块 求 值 和 设置 值 的 须 序 , 这 些 被 设置 的 值 被 用 在 表示 不 同 信 号 值 的 C 表达 式 


F. 


A.2 


D о =] c^ in e Аш М Ep 


ti МОӘ BO М p* єк a e F нк кє PF — єз 
Eon b e O e D 21 бз їп oue Іс B — m= 


SEQ 


一 


code/arcliseq/seg-sid. hel 

TuEI4ASRSESREUETERUERTAHESETATUEREUEHARHAUHRAEAHSUEHGUREAE РЕДІ 
i HCL Description of Control for Single Cycle Y86 Processor SEQ # 
+ Copyrigh? (C) Randal E. Bryant, David R. O'Hallaron, 2002 # 
ЙЕНЕ ЕЕН НЕВЕ EE EEEE EE ESE EEEE НЕНИН ЕНИННИННННЕЕНННИНЕЕ Н 


ЛАЕК ЕЕЕЕЕКЕК E S ES EESE EAE ESE ЕГЕТЕ ЕЛЕН ИИГИЛИКТҮҮ КЫ 
H C Include's. Dcn't alter these H 


ТЕРЕЗЕ НИН ИНИННИНЕНЕЕЕНИННИНИНИННИНИНИННИНИНИИННИНЯН  ИИНИНИННННЕННЕЯ 


quote "Жілсіші «stdio.h»' 

quote "ЖШіпсішде "isa.h"' 

quote 's&include "sim.h"' 

quote 'int sim mainíint агас, char *argv[]):;:' 
quote 'int gen pcí)[return б;}' 

quote 'inL maintint агас, char *argv[])' 

quote ' iplusmode-Ü;return sim mainí(argc,argv);)' 


ТИННИН НННННННЕЕНЕНИННЕНННННИНИННННННННННИННЕННННННННННННННННЕНННННН 
# Declarations. 20 not change/remove/delete any of these # 
ТНЕНЕНЕЕННННИННННННННННННННННННИНИНННИННННННННННННННННННННННЕНИННИНННЕ#Я+& 


HEHE Symbolic representation of Y86 Instruction Codes НИННИНИНИННИНИНИН 
intsig INO? ІІ NOP' 
intsig IHALT өр HALT' 


处 理 器 控制 逐 辑 的 HCL ЖЖ. 


intsig ІНЕУОУІ, '[_RRMDVL ' 
intsig IIRKOVL "І ІЕМОУТ,! 
intsig СЕММОУІ, "1-  RMMOVL' 
intsiq IMRMOVL ' I| MEMOVL' 
intsig IOPL 'I АМР 
intsig lJXX "І JMEP' 
intsig ICALL '1_СА 1 
intsig TRET "Т RET' 


intsig IFPUSHL 'I PUSHL' 
intsig IPOPL СІ POPL' 
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ЕНІН Symbolic -epresentation of Y86 Registers referenced explicitly ##### 


іпіѕіс RESP “ҢЕС ESP' 
intsiq RNONE "ВУС NONE 


$ Stack Pointer 


# Special value indicating "no register" 


ЕНН ALU Functions referenced explicitly 


intsig ALUADD 'A ADD' 


ІН 
# ALU should add its arguments 


test Signals that can be referenced by control logic НИИНННИННИНННИННН 


ЕЗЕНН Fetch stage inputs 
intslq pc 'pc' 

ЕНЕР Fetch stage computations 
intsig icode 'icode' 


intsig ilun "'itun' 
intgiq rA "та" 
int&ig rB гр" 


intsig valC 'valc' 
intsiq valP 'valp' 


НЕЗ Docode Stage computations 
intsig valA 
intsig valB 


'vala' 
'valb | 


БЕЗІН Execute stage computations 
intsig valE "але" 
boolsig Bch 'bcond' 


S443 Memory sLage computations 
intsig valM 'valm' 


ЕНЕ 
# Program counter 
НІ 


# Instruction control code 


Instruction function 


+- ЧЕ + dB +F 


ЕН 


* Value from register А port 
* Value from register B port 


Zi 
* Value computed by АШ 
# Branch test 


нн 
ғ Value read from memory 


ТА iieid їгот instruction 
ЕВ field from instruction 
Corstant trom instruction 
Address of following instruction 


ТЕННІННЕНННННИНННИИННИННИНИНИНИННИНИННИНИНИННЕНИНННИННЕ НЕ НННННИННННИННЕИНН 
# Control Signal Definitions. 


TOEIC ЕНННГИНИНННННИНИНИНИННИНИНИННИНИНИНИНИНИННННИННИННИННИНИНИНИНИННННННН 


# 


790 


70 
71] 
72 
ГЕ 
14 
75 
76 
T7 
78 
79 
80 
Bl 
82 
83 
B4 
8^ 
B6 
AF 
88 
89 
90 
91 
92 
93 
94 
35 
36 
97 
38 
99 
100 
101 
102 
103 
104 
105 
106 
10! 
103 
103 
119 
111 
112 
113 
114 


ШЖ A 


REEERE EERE Fetch Stage НИНИИНИНИНННЕННИНИНИННИНИННИННННИНННННИННИНННН 


Е Does fetched instruction require а regid byte? 
bool need reg.ds = 
lcode in | IRRMOVL, IOPL, IPUSHL, i120PL, 
IIRMOVL, IRMMOVL, IMRMOVL 1; 


# Does fetched instruction require a constant word? 
pocl need valc = 


icode in { IIRMOVL, IRMMOVL, IMRMOVL, IJXX, ICALL }; 


bool instr, valid - icode in 
{ INOP, IHALT, IRRMOVL, IIRMOVL, IRMMOVL, IMRMOVL, 
IOPL, TJXX, ICALL, IRET, EPUSHL, IÍIPOPL }; 


ЕРИНННИНННЕНІННЕЯ Decode Stage ЭНИННИННИНИНИННИННИНИННИННИНННННННН 


ЕР What register should be used as the А source? 

int sSrcA = | 
icode in { IRRMOVL, IRKMOVL, ТОРІ, IPUSHL } : га; 
icode іп | IPOPL, IRET ) : RESP; 


l : RNONE: # Don't пеес register 
Із 


ЕН What register should be used as the B source? 

int srcB = [ 
ісойе in { IOPL, IRMMOVL, IMRMOVL } : rB; 
icode in { IPUSHL, IPOPL, ICALL, IRET ) ; RESP; 
l : RNCNE; # Don't need register 

); 


ЕЕ What register should be used as the E destination? 
int dstE = | 

icode in { IRRMOVL, IIRMOVL, IOPL) : rB; 

ісойе іп { IPUSHL, IPOPL, ICALL, IRET 1 : RESP; 


1: RNONE; # Don't need register 
1; 


** What register should be used as the M destinatlon? 
int dstM - [ 

icode іп ( IMRMOVL, IPOPL ] : rÀ: 

l : RNONE; 8 Don't need register 


„15 
216 
117 
118 
119 
120 
121 
142 
123 
124 
125 
126 
127 
128 
129 
130 
131 
132 
133 
134 
135 
136 
137 
138 
139 
140 
141 
142 
143 
144 
145 
145 
147 
148 
149 

50 
151 
152 
153 
154 
155 
156 
157 
158 
159 
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БЕРЕРІ Execute stage HAHH HA Eii iiH iE R ГІНЕН ЕЕН ЕЕЕ 


ЕҢ Select input А to АШ 

int aluA = | 
icode in ( IRRMOVL, ТОР ) : valà; 

Ісойе in { IIRMOVL, IRMMOVL, IMRMOVL ] : valC; 

icode in { ICALL, IPUSHL } -4; 

icode in { IRET, IPOPL } : 4; 

# Other instructions don't need ALU 


|; 


ЕР Select input B to ALU 
iut a.uB - [ 
leode in | IRMMOVL, IMRMCVL, IOPL, ICALSL, 
IPUSEL, IRET, IPOPL ) : valB; 
icode in ( IRRMOVL, IIRMOVL ) : 0; 
# Otter instructions don't need АШ) 


1; 


## Set спе ALU function 
int alufun = | 
icode == IOPL : ifun; 
1 : ALUADD; 
1; 


## Should the conditior codes ре updated? 


bool вер cc = lcode in ( IOPL ); 


füstHSE4 STU RUE S4 Memory Stage ВЕНЕРЕ ЕВ ЕНИНИНИИИНИИНИНННИЯННИЯҰ 


ЕН Set read control signal 
bool mem read = icode in ( IMRMOVL, IPOPL, IREF 1; 


** Set write control Signal 
bool mem write = icode in | IRMMOVL, IPLSHL, ICALL }: 


ЯҒ Select memory address 

int mem addr z [ 
icode in 4 TRMMOVL, ÍPUSHL, ICALL, IMRMOVL ) : valE; 
icode in { :POPL, IRET 1 : valà; 
# Other instructions don't need address 

1: 


## Select memory input data 
int mem data = | 





HR A 


160 # Value from register 
151 ісоде іп ( IRMMOVL, IPUSHL ] : valh; 
162 # Return PC 
163 icode == РСА : valP; 
164 # Default: Don't write anything 
165  ]; 
] 66 
l67 (ЯЯҒЕЯЕРНЫНЯННҢ А Program Counter Update ERRER HE I IE a ТІННЕН 
168 
169 ## What address should instruction be fetched at 
170 
171 int пем рс = | 
1+7 # Call. Use instruction constant 
173 lcode == ICALL : уа1С; 
174 * Taken branch. Use instruction constant 
175 їсоде == IJXX && Bech : valC; 
176 # Comple-ion of RET instruction. Use value from stack 
177 icode == IRET : valM: 
178 # Default: Use incremented РС 
179 1 : ValF: 
180 |; 
—— 一 一 coderarch/seq/seg-std.hel 
А.З SEQ+ 
——7 code/arch/seq/seq- -std. hcl 
1 АБЕКЕ ЕЕ ЕЕЕ ЕК ИШКЕ КЕЕ ЕКЕУ ЕНЕ БЫНЫ УЖЕ ЕН ЫН НЕ ЕНЕ 
2 # HCL Description о: Control for Single Cycle Y86 Processor SEQ+ ft 
3 ғ Copyrigrt (С) Randal E. Bryant, Пауіс R. O'allaron, 2002 # 
4 # ЖЕЕ ЕЕЕ АЯК ЕНЕНЕ ЕЗ ЖОЕ ЕНЕНЕ ЕЕЕ ЕЕЕ ЕЕЕ НЕНЕН ЕЕ ЕЕН ЕНШЕ НЕНЕН 4% 
5 
Б Жл ЕКЕ Ы ЕЕ Ы ЕЕЕ ЕЕЕ ЫЫ НІНЕН 
7 H С Include's. Don't alter these # 
8 VETTSRSSSERHETAHETATETEHSSERRASERREA ЫЫ A AE FEAE EAE E НЕН ЕЗ 
9 
10 quote '&include «stdio.h»' 
11 quote '#include "isa.h"' 
12 quote '&include "sim,.h"' 
13 quote 'int sim mainí(int argc, char *argv.]);' 
14 quote 'int gen, new pcí()freturn 0; ) ' 
15 quote 'inL main[int ағас, char *argví])' 
16 quote ' ipiusmode-l;return sim main(argc,arqv):]' 
17 
18 


тЕОТЕРЫНЫНЫНЫҒ ЕЕ ЫНЫ НННННЕНҢ ЕНЕНННННИНИИИИНИИ НЕН ВНИИ ВЯ Я 
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# Declarations. Do not change/remove/delete any of these # 
ИННИНИНИНИНЕНИННННИНИНИННЕЕИННИНИНИНЕЕНИНИННИНИНЕИННИНЯ НИЯ НЕ ЕНЕНЕ Я 


BUSES Symbolic representation of ҮЁ& Instructior Codes #ЕРЕЕНЕЕ РЕННЯ 
intsig INOP 'I_NOP 

intsiq IHALT 'I HALT' 

intsig IRRMOVL СІ RRMOVL' 

intsic IIRMOVL  'I, IRMOVTL' 

intsic IRMMOVL  'I RMMOVL' 

intsig IMRMOVL  'I МЕМО," 


intsig IOPL 'Y ALU' 
intsig IJXX "I MP! 
intsig ICALL "І САП” 
intsig IRET І КЕТ! 
intsig IPUSHL — :1l PUSEL' 
intsig IPOPL I БӘРІ! 


#####% Symbolic representation of ҮНЕ Registers relcerenced explicitly &$34 


intsigq RESP "КЕС ESP' % Stack Pointer 

intsiq RNONE "КЕС NONE' # Special value incGicatbinq "no register" 
Й#Е#%# ALU Functions referenced explicitly XLI. 
intsig ALUADD "А ADD' Ң ALU should add its arguments 


##### Signals that can be referenced by control logic ПининиииинынынныН 


HHHH PC stage inputs нн 


ЕР А1! of these values are based on those from previous instructior 


ілізісу рІсойе 'prev icode' t Instr. control code 

intsig pValC 'prev valc' # Corstant from instruction 
intsig pValM 'prev. valm' * Value read from memory 
intsig pValP 'prev valp' # Incremented program counter 
boolsig pBoh 'prev bcond' * Branch taken Elaq 

#Ё}## Fetch stage computations HEHH 

intsig icode 'icode' # Instruction control code 


intsig ifun 'ifun' Instruction íunction 

rA field from instruction 
rB field from instruction 
Constant from instruction 


Address of fo lowing instruction 


intalqg rà 'ra' 
іпізіс rB 'rb' 
іпевіп valC 'valc' 
intsig valP 'valp' 


+ dE db + зе 


ЕЖЕН Decode stage computations ЕНІН 
intsiq valàÀ 'vala' # Value from register А port 
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64 
65 
56 
67 
68 
69 
70 
71 
72 
73 
74 
75 
76 
77 
78 
79 
80 
81 
82 
83 
84 
85 
86 
87 
88 
89 
90 
91 
92 
93 
94 
95 
96 
97 
98 
99 
102 
101 
102 
103 
104 
105 
106 
107 
108 


Mt XA 


intsig valB 'valb' 4 Value from register B port 


ЯН Execute stace computations HEHEH 


intsig valE 'vale' * Value computed by ALU 
рооіѕ1ч Bch 'bcond' # Branch test 

ЫНЫ Memory stage computations pitis 

intsig valM 'valm' # Value read from memory 


ИНИИНИНИННИНИНИИНИНИНЗ ЕНИЕЕИИНИНИНВНИНИНИНИНИЗНИНИИННИНИНИНИН e EHI 
i Control Signal Definitions. # 
kite EE E E SEA ES ИННЕННННЕНЕНН ННННННЕНИНННИНЕННЕЕИННИНИНИНИНИЕЕН ЕЕЕ 


ВЕНН ЕНЕНЕ Program Counter Computation ІННЕНИНИННИННННИННИНҒНЯ 


# Compute fetch location for this instruction based on results from 
t previous instruction. 


int pe = | 
# Call. Use instruction constant 
picode == ICALL : руа1с; 
# Taken branch. Use instruction constant 
plcode -- IJXX && pBch : pvalC; 
+ Completion of RET instruction, Use value from stack 
pIicode == IRET : pValM; 
* Default: Use incremented PC 
l : pValP; 
|; 


EESTI ES EHE EE EE Fetch Stage AEE AE HE E E E E E E E РНН ЕЕЕ Н ЕЕЕ HFH 


ғ Does Тексһес instruction require а regid byte? 
bool need -egids = 
icode іп { IRRMOVL, IOPL, IPUSHL, IPOEL, 
IIRMOVL, IRMMOVL, IMRMOVL }; 


# Does fetched instruction require a constant word? 
bool need valC = 


icode in í IIRMOVL, IRMMOVL, IMRMOVL, IJXX, ICALL ): 


boo] instr valid - icode in 
{ INOP, IHALT, IRRMOVL, IIRMOVL, IRMMOVL, IMREMOVL, 
IGPL, МАХ, ICALO, IRET, IPUSHL, IPOPL }; 
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SER4SÉHPRESSERSSÉ Decode Stage Ai EEIEIE H a HdE a EAE a HE E H E E H A НЕЕ EE E EH H 


## What register should be used ав the А source? 

int srca = | 
icode in [ IRRMOVL, IREMOVL, ТОРІ, IPUSHL } : ГА; 
icode in [ IPOPL, IRET ) : RESP; 
1 : ЕМОМЕ; # Don't need register 

1; 


## What register should be used as the E source? 

irt srcB - [ 
icode іп { IOPL, IRMMOVL, IMRMOVL ] : rB; 
icode in ( IPUSHL, IPOPL, ICALL, IRET } : RESP; 
i: RNONE; + Don't need register 

1; 


#Е What register sbould be used as the E destination? 
int dstE - [ 
icode in { IRRMOVL, IIRMOVL, ТОРЫ) ; rB; 
icode іп { РОЗН, IPOPL, iCALL, IRET 1 : RESP; 
1: RNONE; ? Don't need register 
]: 


## What register should be used as the M destination? 
int dstM - [ 

icode in { IMRMOVL, IPOPL ) : ЕА; 

1: RNONE; # Don't need register 
1 


ҰЗРЕРЕРЕНЕЕЗЗНЕ Execute Stage ННИНИНИЯФЕИВИНИНИНИИНИЕРННИНИННИНННН 


## Select input А to ALU 
int aluA = | 
icode in { IRRMOVL, ТОБЫ, ) : valA; 
icoóde in 1 TIIRMOVL, IRMMOVL, IMRMOVL ) : valg; 
icode in ( ICALL, ;PUSHL ) : -4; 
icode in { IRET, IPOPL } : 4; 


# Other :nstructions don'- need ALU 
1; 


## Select input B to ALU 
int aluB - | 
їсоде in { IRMMOVL, ІМЕМОУІ,, IOPL, ICALL, 
IPUSHL, IRET, ІРОР, ) : valB; 
icode in { IRRMOVL, IIRMOVL } : Q: 


HKA 











154 # Other instructions don't need ALU 
155 1; 
156 
157 ЕН Set Lhe ALU function 
158 inr alufun = | 
159 icode == ТОРІ : ifumn: 
180 1 : ALUADD; 
161 1; 
162 
163 Ян Should the condition codes be updated? 
164 bool веб cc = icode in ( ТОРЫ }; 
165 
166 CRSSERSASASTESSSE Memory Stage ЖФИРИННННИННИЯНВИИИИНИНИНИИННЯЯЯНЫН 
167 
168 ЕҢ Set read control signal 
169 bool mem read = icode іп 1 IMRMOVL, IPOPL, IRET }; 
170 
171 ## Set write cortrol signal 
172 bool mem write = icode іп 4 IRMMOVL, IPUSHL, ICAL }; 
173 
174 Яғ Select memory address 
175 int mem addr = | 
175 icode in 1 IRMMOVL, IPUSHL, ICALL, IMRMOVL ] : valFE: 
177 icode in 4 IPOPL, IRET } : val; 
178 # Other instruztions don't need address 
179 1; 
180 
181 ## Select memory input data 
182 int mem data = | 
183 % Value Irem register 
184 icode іп ( IRMMOVL, IPUSHL 1 : ма1А; 
185 # Return PC 
186 icode == ICALL : valP: 
187 # Defauit: Don't write anything 
188 |; 
m code/arch/seq/seg-^ std. hel 
A.4 PIPE 
一 code/arclypipe/pipe-std.hci 
1 тететте ЕН НЕНЕН НЕННЕНННННННННННННЕНННННННННННННННННННННННӨН 
2 # НСІ Description of Control for Pipelined Y36 Processor # 
3 * Copyright (C) Randal E. Bryant, David P, Q'Hallaron, 2002 # 
4 


ННИННИНННИНИНИНИНИНИНИНИНИННИНИНИНИНИНЕНИНИНННИНЕННЕНДЕНЕН ДЕНІ 


ARTE УНЕ) HCL 描述 797 


ЕЕРТЕЕНЕРЕЕЕ ТЕ ЕЕЕ НК КЯНУЕ#ЯЯ ЕЕЕ ҒА ЕЕЕ ЕНГЕН 
# C Include's. Don't alter these # 


FukSHTSSATRUBERUTRETESUHHMTEHESEBEENSTERERRUSESETUSSESESESTAHETEHSTESIE 


quote 'tinclude «stdio,.hs' 

quote '#include "isa.h"' 

quote 'tinclude "pipeline.h"' 

quote 's&include "stages.h"' 

quote 's$include "s-m.h"' 

quote 'ipnt sim лаіл(іпі arge, char *argv[]);' 

quote 'int main:int ағас, char *argv[l):return sim mainíargc,argv);]' 


КЕРЕП РР ЕКНЕЕРЕВЕН ЕНТ ТРЕНЕР ТТАР Т ЕВРЕРЕЫНН ЕРЕШЕ 
# Declarations. Do not change/remove/delete any of these қ 
EEE ELEELE EEEE EEEE EEEE EEEE ИННИ ТЕ НЕН НЕЕ ЕЕЕ ЗЕРЕН 


ЕРЕН Symbolic -epresentation of Y86 Instruction Codes ааа за. 
intsig ІМОР ' [_NOP ' 
intsig IHALT 'l HALT' 
intsiq IRRMOVL Il REMOVLE!' 
intsig IlRMOVL D IRMOVL!' 
intsig IRMMOVL "ГІ RMMOVL' 
intsig IMRMOWI, ' TL. MRMOVL' 
intsig ICPL Т ALU' 
intsig IJXX 'I ІМР 
intsig ICALL Т CALL' 
intsigd IRET 'L RET' 
intsig IFUSH. "І PUSHL' 
intsig ІРОРІ, "Торо? 


fid Symbolic representation of Y86 Registers referenced explicicly SH 
їпїв1д RESP "REG ESE!' # Stack Pointer 
intsig RNONE "REG,NONE' # Special value indicating "по register" 


*üs$* ALU Functions referenced explicitly БЕРЕРЕЕНЕНЕНЕ ЗІНЕ 
intsig ALUADD "А ADD' * ALU should add its arguments 


На Signals that can be referenced by control logic ЕТЕНЕ 
FHF Pipeline Register F вит ана ЕЕ ЕУ ЕЕЕ ЕЕЕ ННІ 
intsig Е predPC pc curr-»pc' # Predic-ed value of PC 


ІНЕ Intermediate Values іп Fetch Stage ОФНРИНИННИНИНИНИННИНИНИНИННННИНҒ 


/96 


50 
51 
52 
53 
54 
22 
55 
57 
58 
59 
50 
51 
62 
63 
54 
n5 
56 
67 
68 
59 
10 
91 
72 
73 
14 
75 
5: 
7 
7H 
79 
80 
81 
82 
83 
84 
85 
86 
8] 
ad 
89 
90 
91 
32 
33 
94 


intsig f icode 
intsig f .ifun 
intsig f, valC 
intsig f valP 


BEA 


'if id пехі->1соде' # Fetched instruction code 
'if id next-»ifun' # Fetched instruction function 
‘if id next-»valc' # Constant data of [eLched Lust ruct ion 


КІР 14 next-»valp' # Address of following instruction 


ӘНЕ Pipeline Register D }#Е# 0% НЕНЕН Pg EE HE DH ЕЕЕ ЕЕЕ # ЕЕЕ 


intsig D icode 
intsig D rA 
intsig D ЕВ 
intsig D valP 


'uf id curr-»1icode' # 
'if id curr-»ra' қ 
"ій id curr-»rb' # 


'it id curr-»valp' ü 


Instruction code 

rå field from instruction 
rB field from instruction 
Incremented PC 


#Е### Intermediate Values in Decoce Stage Ят RE HHO EH SEHE RE Я 


intsig d srcA  'id ex next-»srca' 8 srcA from decoded instruction 
intsig d srcB  'id ex next-»srzb' 4 srcB from decoded instruction 
intsig d rvalA ‘с regvaia' # valà read trom register file 
intsig d rvalB'd regvalb' * valB read from register file 


CHEESE Plpeline Regis.er E НИН ИНЕ ЕЕЕ ЕЕЕ E E E A H HH 


intsig E icode 
intsig E itun 
intsjg E valC 
intsig E srcà 
jntsig E уа1А 
intslqg E вгев 
intsig E valB 
intsig E dstE 
intsig E dstM 


"ій ex curr-»2icode' 
'id ex curr--»iftun' 
'id ex curr-»valc' 
'id ex curr-»srca' 


# 
# 
# 
£ 
19 ex curr-»vaàla' # 
"14 ex curr-»srcb' # 
114 ex curr-»valb' Ё 
id ex curr-»deste' # 

# 


"Іі ex carr-»düestm' 


Instruction code 
Instruction function 
Constant data 

Source A register ID 
Source А value 

Source B register IF 
Source B value 
Destinaticn E register ID 
Destinaticn M register ID 


FERE Intermediate Values in Execute Stage ИЕ EHEHEH БЕНЕН 


intsig e, valE 
boolsig e Bch 


HHHH P)peline 
intsig M icode 
intsig M ifun 
intsig M valA 
intsig M CStE 
intsig M valE 
intsig M, CstM 
boolsig M Всп 


"ех mem next--vale' 
"ех mem next-»takebrzanch' 


Register M 
"ах mem curr-»icode' 
"ех mem curr-»ifun' 
"ех mem carr-»vala' 
"вх mem cairr-»deste' 
ex шет curr-»vale' 
"ех mem curr--»destm' 
"ех mem curr-»takebranch' 


# valE generated Ly АШ 
# Аш I about to branci? 


HHRHH 

# Instruction code 

# Instruction function 

# Source А value 

# Destination E register ID 
f ALU E value 

k Destination M register `D 
* Branch Taken fiag 


"hs** Intermediate Values in Memory Stage dse8St4SHUgSE HS EU HUE НЫН 


intsig m valM 


'mem wb next-»valm' # 


valM generated by memory 


115 
116 
117 
118 
119 
120 
141 
122 
123 
124 
125 
125 
127 
124 
129 
13% 
131 
132 
133 
133 
135 
135 
137 
138 
133 


AE GR dq He НСІ, 描述 


ӘННЕН Pipeline 3egister W ФННИНИНИВНИНИНИНИНИННИНННЕЕЕЕ НЕНІ 


іпініс W icode 'mem wb curr-»icode' t 
intsig W dstE 'mem wb curr-»2deste' t 
intsig W valE 'mem wb curr-»vale' ғ 
inrtsiq М datM ‘тем wb curr-»destm' Ў 
intsig W valM 'mem wb curr-»valm' # 


IRrsrruct-on code 
Destination E register ID 
AIU E value 

Destination M register ID 
Memory M value 
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БЕНЕН ЕЕЕ ЕНЕ ЕКЕН ЕЕЕ ЕЕ КЕЕ КЕЕ ЕКЕ ЕЕКАТ# ЕЕЕ ЕЕЕ КЕКЕ RS RW 


# Control Signal Definitions. 


H 


ЕНИНИНННИНННИРЯЯ Т ЕЕ КЕНЕЕН ЕЕ НЕЕЕНЫНЕЕІНІНЕЕ НІНЕН 


ЕЕЕ ЕЕЕ ЕЕЕ. 


## What address should instruction be fetched at 


int f_pc = | 
# Mispredicted branch, Fetch at 
M icode == ІЛХХ &k& !M,Bch : M, valA; 
# Completion of RET instruction. 
Ы icode IRET : W valM: 
t Default: Use predicted value of FC 
1: Еоргеарс; 


а = 


Е 


incremented PC 


# Does fetched instruction require a regid byte? 


bool need regids = 
t ісейе in 1 IRRMOVL, ТОРІ,, IPUS 
ILRMOVL, IEMMOVL, 


HL, IFOPL, 


IMRMOVL k; 


t Does fetched instruction require a constant word? 


hool need val? = 


f icode in { iiRMOVL, IRMMOVL, IMRMOVL, 10Хх, ICALL l; 
bool instr valid = i icode in 
| INOP, IHALT, IRRMOVL, IIBMOVL, IRMMOVL, IMREMOVL, 
iOPL, lIJIXX, ICALL, IRET, IPUSHL, ІРСРІ, ]: 
* Predict next value of PC 
int new F predrC = | 
t ісоде ir { IJXX, ICALL } t. valg: 


1 E valP; 


БННННННИНИНЯІНННЕ Decode Stage ЭНЕННИИИНИННИННИИНИНИНИННИНИНИННННИНН 


retch Stage ӘНИИНИНИНИЯЯНИЯЯНЕЯЯНЫННЫЕ НЕЕ 
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149 
141 
142 
143 
144 
145 
146 
147 
148 
149 
150 
151 
152 
153 
154 
155 
156 
157 
15В 
155 
160 
16] 
164 
153 
184 
165 
165 
167 
168 
158 
170 
171 
173 
173 
174 
175 
176 
177 
178 
179 
180 
181 
182 
183 
184 


HRA 


## What register should be used as khe A source? 
int new E srcà = | 
D icode in í IRRMOVL, IRMMOVL, ТОРЫ, IPUSHL ) : РА; 
D icode in ( IPOPL, IRET ) 
1 : RNONE; Ж Lon't need register 


1; 


RESP: 


*i What register should be used as the B source? 
int new E srcB = | 


1; 


4 icode in | IOPL, 


IRMMOVL, 


D icode in { IPUSHL, IFPOPL, 
1 : КМОМЕ; # Don't need register 


IMEMOVL ) : D rB; 
ICALL, IRET ` : RESP; 


## What register should be used as tte E destination? 
int new E dst% = | 


D_ycode іп { LRRMOVL, 


D 1соде in 1 IFUSHL, IPOPL, 
1 : RNONE; # Don't need register 


IIRMCVL, IOPL) : D rB; 


ICALL, IRET } : RESP; 


## What register should be used as the M destination? 
int new E dstM - [ 


D icode in 1 IMRMOVL, 
1 : RNONE; 


13 


ІРОР, |) : D га; 
* Don't need register 


84 What should be the А value? 
*5 Forward into decode stage for valA 
inb new E valA = | 
D icode in { ICAL,L, IJXX } 


j; 


d srca == E dstE : 
d srcÀ == M dstM : 
d srcàÀ == M dstE : 
d sSrcA == Н dstM ; 


d srcAÀ == W CSEE 


int new E valB = [ 


d srcB == E dstE 
d s85rcB == M dstM 
Д БҮСЕ == M üdstE 


e valk; 
ін valM; 
M valE; 
W valM; 
W valE; 


e ма1р; 
: m, valM; 
: M valEb: 


i 
4 
# 
# 


f 


D valP; # Use incremented PC 
Forward valB from execute 
Forward valM from memory 
Forward valE from memory 
Forward valM from write back 
Forward valE from write bacx 


"10: а туа1А; # Use value read from register file 


* Forwarü valE from execute 
* Forward valM from memory 
* Forward valE from memory 
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d БҮСВ == W_dstM : W valM; € Forward valM from write back 
d srcB == М detE : W valE; # Forward valE from write Dack 
1: d rvalB; * Use value read from register file 


1; 
ЕНЕ ЕНЕНЕ ЕЕЕ Execute Stage ШБНИРЕНЫННЕН ЕРТЕН ЕН ЕРЕН ГІНЕН 


ЯН Select input A to ALU 
int aluA = | 
E icode in { IRRMOVL, IOPL } : E vali; 
E icode in { IIRMOVL, -RMMOVL, IMRMOVL ] : E, valC; 
E icode іп { ICALL, IPUSHL ) : -4; 
E ісопе in | IRET, IPOPL ) : 4; 
Ë Other instructions don't need АШ) 


## Select input B to ALU 
int aluB = | 
E icode іп { IRMMOVL, IMRMOVL, ICPL, ICALL, 
IPUSHL, IRET, IFOFL } : E valB; 
Е icode in { IRRMOVL, IIRMOVL ] : D; 
* Other instructions don't need ALU 


Із 


## Set the ALU function 

irt alufun = | 
E lcode == ISPL : E ifun: 
l : ALUALDD; 

1; 


## Should the condition codes be updated? 
bool set cc = E icode == -OPL: 


НЕННЕ ЕЕЕ Е ЕНЕ Memory Stage ЭНННИНИИИНИНИНИНИННИНННИНИННИННИНЯНЫННН 


ЯҒ Select memory address 
in- mem addr = | 
M icode in í IRMMOVL, IPUSHL, ICALL, IM3MOVL ) : M valE; 
M ісоде in 4 IPOPL, IRET ) : M val; 
* Other instructions don't need address 
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226 
227 
228 
229 
230 
231 
232 
233 
234 
235 
236 
237 
238 
235 
240 
241 
242 
245 
244 
245 
246 
247 
245 
249 
250 
AD. 
252 
253 
254 
255 
256 
257 
258 
259 
260 
261 
252 
283 
264 
265 
266 


ЖА 
Із 


## Set read control signal 
bool mem read = М icode in { IMRMOVL, IPOPL, IRET ); 


## Set write control signal 


bool mem write = M icode іп { IRMMOVL, IPUSHL, ICALL }; 


ЕРЕЖЕНІ Pipeline Register Control 8535S3düS3XStÓquigpug ds ЕНІНІҢ 


t Should I stall or inject a bubble into Pipeline Register F? 
% АС most one of these can be true. 
bool Е bubble = 0; 
bool F stall - 
* Conditions ior a load/use hazard 
E icode in ( IMHMOVL, IPOFPL } ké 
E БЕМ in í d srcA, d srcB } ii 
# S:alling at fetch while ret passes through pipeline 
IRET in (Б. icode, E icode, M icode }; 


* Should I stall or inject a bubble into Pipeline Register D? 
* At most one of these can be trus. 
bool D stall - 

E Conditions for a load/use hazard 

E icode in { IMRMOVL, IPOPL } && 

E dstM in 1 Я Srcà, d srcB 1; 


bool D bubble - 
# Mispredicted branch 
FE icode == IJXX && le Bch! || 
* Stalling at fetch while ret passes through pipeline 
-RET in | D icode, E icode, M icode ); 


# Should I stall or inject a bubble into Pipeline Register F? 
% АС most one of these can be true. 
bool E stail = 0; 
bool E bubble - 
+ Migpredicrec branch 
(E icode == IJXX Kk .e Fchi || 


t Conditions for a load/use hazard 


257 
258 
269 
210 
27] 
272 
213 
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E icode in { IMAMOWL, IPOSL ] ве 
E detM in í d ягса, d вгеВ); 
# Should 1 stall or inject a bubble into Pipeiine Register М? 
H At most опе of these can be true. 
bool M srall = ü; 
bool] M bubbie = 0; 
————— — — ceuodelarcWpipe/pipe-sid. hel 
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В2 ИНЕ 508 
83  csapp.h 头 文件 809 
B.4  csapp.c 源 文 件 813 
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得 译员 应 该 总 是 检查 系统 级 前 数 返 回 的 错误 代码 。 有 许多 细微 方式 导致 错误 的 出 现 ， 只 有 使 用 
内 赃 能 够 提供 给 我 们 的 状态 信息 才能 理解 为 什么 有 这 样 的 错误 。 不 幸 的 是 ， 程 序 员 人 往往 不 愿意 进行 
错误 检查 ， 因 为 这 使 他 们 的 代码 变 得 很 斋 太 ， 将 一 行 代码 变 成 一 个 多 行 的 条 忻 语 句 。 错 浊 检 查 也 是 
很 令 人 迷惑 的 ， 因 为 不 同 的 蝴 数 表 小 不同 方面 的 错误 ， 

在 编号 本 书 时 ， 我 们 面临 类 似 的 问题 。 方面， 我 们 希望 我 们 的 代码 示例 阅读 起 来 简洁 简单 。 
n— HB. ПХБ ЛЕЛЕ] “个 错误 的 印象 ， 以 为 可 以 省 略 错误 检查 。 为 了 解决 这 些 问题 ， 
我 们 采用 了 一 种 基于 错误 处 理 包 蒜 永 数 【error-handling wrapper? 的 方法 ， 这 是 出 W. Richard Stevens 
侍 他 的 网 络 编程 教材 [81] 中 最 先 提出 的 。 

其 出 想 是 ， 给 定 某 个 基本 的 系统 级 国 数 foo， 我 们 定义 一 个 有 相同 参数 、 只 不 过 开头 字 苹 大 写 
了 的 包装 函数 Foo. ARAA HHA AA ARAR. RRRA RATE, WAERT 
ЯНА, FAH. ЖШ, CERAR. HG ТНА, ARKA t M: K 
闹 数 元 件 一 样 。 换 名 话说 ， 如 时 程序 使 用 包装 函数 运行 正确 ， 那 么 我 们 把 每 个 包装 函数 的 第 一 个 字 
甘 小 瑟 计 重新 编译 ， 也 能 正确 运行 。 

е ЕНЕ 个 源 文件 Cesapp.o 中 ， 这 个 文件 被 编 详 和 链接 到 每 个 程序 中 ,一 个 独立 
的 头 文 件 《csapph) "PR EXE EUH e p S ga ДУ, 

本 出 来 给 出 了 一 个 关于 Unix 系统 中 不 同 种 类 的 异 误 处 理 的 指南 , 远 给 出 了 不 同 风 格 的 错误 处 理 
包 深 阴 数 的 示例。 为 了 方便 参考 ， 我 们 还 包括 了 csapp.h 和 csapp.c Хз. 


B.1 Unix 系统 中 的 错误 处 理 


本 书 中 我 们 造 到 的 系统 级 函数 调用 使 用 种 不 同 风格 的 返回 鲁 误 ，Unix 风格 的 、Posix 风格 的 
和 DNS ДЖА. 


Unix Bi fg SERE 

像 fork 和 wait IX FF Unix ИН AZ USE ER C CELA y ЕК Posix 函数 ) HORER 
BERT. BB HAM. lin, C4 Unix 风 档 的 wait 函数 过 到 :个 错误 【例如 没有 了 进 
程 要 回收 )， 它 就 返回 一 1!， 并 将 全 局 变量 errno 设置 为 指明 错误 原 央 能 异 误 代码 。 如 果 wait 成 功 完 
获 ， 那 么 它 回 返回 有 用 的 结果 ， 也 就 是 局 收 的 子 进 穆 的 PID. Unix 风格 的 错误 处 理 代 公 通 党 及 有 以 
FI 

1 if ((pid = wall (NULL) « O) ( 

2 tprintfistderr, "wait error: %=\п", sSirerror(errno)]): 

3 exitii): 

4 } 


strerror EK 28 vx [e] Ж. ermo {ЈА А. 


Posix 风格 的 错误 处 理 

Vr 4 ИЧ Posix 函数 ， 例 如 Pthread 基数 ， 只 用 返回 值 束 表明 成 盎 (0) 或 者 失败 CIE OO, 在 
何 有 用 的 结 吕 都 返 回 在 道 过 引用 传递 进来 的 函数 参数 中 。 我 们 称 这 种 方法 为 Posix 风格 的 错误 处 理 。 
例如 ，Posix 风格 的 pthread_create 肯 数 用 它 的 返回 值 米 表明 成 功 成 基 失败 ， 而 通过 引用 将 新 创建 的 
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线程 的 ID CHHBIEHRO 返回 放 在 它 的 第 - -个 参数 中 。Posix 风格 的 错误 处 型 代码 通常 其 有 以 上 形 


X: 
l il tí(reLcode = pthread _createl&tid, NULL, thread, NULL)) = 0б) í 
2 fprintf(stderr, "pthread create error: s\n", strerror(retcodeëe;); 
3 exit:D): 
4 } 
DNS ЖИЕ АЛЫИ 


gethosibyname 和 gethostbyaddr РАЗ Kx DNS i 域名 系统 )】 EIZH, EDA AP 一 种 返回 错 
УКШ Л ә ЕҢБЕК NULL 指针 ， 并 设置 全 局 变量 hemo, DNS ЖИ FJ FH 4b ED 
党 和 有 以下 形式 ，; 


1 if (ip = geLhostbynameiname)) == NULL) Í 


2 fprintfístderr, 'qethostbyname error: en:i", hstrerroríh errzuo!); 
E exiLid): 

4 } 

BERG РИКИ ОЛЕ 


MAT, RIELE КОНАК E AREA ЛЕШЕ ААК И, &: 


tinclude "csapp.n" 


void unix error!char *msg): 


void posix error[int code, char *msc): 
void dns error(char *msg); 
void app erroríchar "*msqd); 





小 如 它们 的 名 字 表 明 的 那样 ，unix_error、posix_error 和 dns. error 函数 报告 Unix 风格 的 错误 、 
Posix MA HJH RA DNS 风格 的 错误 ， 然 后 终止 。app_error 峭 数 是 为 了 方便 报告 应 用 错误 。 它 只 是 
简单 地 打印 它 的 给 入， 然后 终止 。 网 B,1 Bog TXE А n ea. 


— —Fy  - — 





code/src/esapp.c 
void џліҳ еггог{сһаг *msg) /*#unix-style error */ 

| 

fprintfíí(stderr, "£s: Жалп", msg, strerrorí(errmo)); 

Exit (Oy: 


void poslx_error(int code, char *msg) /% posix-style error */ 
| 

Iprintf[stderr, "$s: %ч\п", msg, strerrorícodel]; 
10 exiti(0); 


13 void dns еггогісһаг *msg; /* dns-style error */ 
14 { 


808 "B 





15 fprintt(stderr, "$s: DNS error d\n", msg, h errno); 
16 ехісі0); 

17029 

18 

19 void app erroríchar *msg) /* application error */ 

20 1 

21 fprintfistderr, "%=\п", msg): 

22 exit(0); 

23 | 





code/src/csapp.c 








code/src/csapp.c 
pid t Магі iint *status] 
i 

pid t pid; 


12 {ipid = wairz(status)) < 0} 
unix error("Wait error"l; 
return pid; 





— code/sre/csapp.c 
图 B.2 unix 风格 的 МОЙНЫНАН 


B.2 错误 处 理 包 装 函 数 
TAE en RU НЕНІ ІНДЕ: 
Unix FUSE B D APERIRE 


图 B.2 展示 了 Unix 风格 的 wait 函数 的 包装 函数 。 如 果 wigo- ERR, а р ТЕ 4 
НЫ, ЖАЛАНЫ. m, vL RII PID, 


图 ВЗ 展示 了 Unix 风格 的 Kil ARARA. A, XU ЫЕ) wait 不 同 , ERI E X [uj void. 








mee — ——— COde/src/csapp.c 
1 void К111{р1а_ t pid, int signum! 
á { 
3 int rc; 
d 
Б if ((rc = killiípid, sigrum)] < 0) 
Б unix errorí("Kill error"); 
? | 
code/sre/csapn.c 





&pB.3. Unix 风格 的 由 函 数 的 包装 函数 


Posix 风格 的 错误 处 理 包装 打数 
ОВА 展示 了 Posix 风格 的 pthread_detach АЖЕ. ЫЛЫ Posix MAWAR 8, 


它 的 错误 返 轩 码 中 不 会 包含 有 用 的 结果 ， 所 以 成 功 时 ， 包 装 消 数 授 | void. 


1 void Pthread detachi(pthread t tid! { 
2 int rc; 
3 
4 if {{тс = pthread detachítid): != 0) 
5 posix errorírc, "Pthread detach error"); 
Б } 
B.4 Posix 风格 的 pihread detach 函数 的 包装 函数 
DNS 风格 的 错误 处 理 包 装 困 数 


锚 误 处 理 


图 B.S 展示 了 DNS 风格 的 gethostbyname FR ri eu РЕ ЖТ. 


i 


it ( 


Qo -J түл ẹ ke PJ н 


} 


struct hostent *р; 


atruct hostent *Gethostbyname(const char *name) 


(p = gethostbynameíname)] == NULL) 


dns errorí"Gethosthyname error"); 
return p; 


509 


code/sre/csapp.c 


codefsrc/csapp.c 


code/sreicsapp.c 


——— F P —  epdefsro/csapp.c 


00 
со 


8include 
*incilude 
include 
Яіпсішнде 
Біпсішде 
#flnclude 


O no — o cm лы оғ 


上 
с» 


tinclude 
+#include 
include 
#include 


= = к 
іс bj Lm 


В,5 DNS 风格 的 gethostbyname 函数 的 生 装 函数 
csapp.h 头 文件 


kifndef _ CSAPP H . 
"define _ CSAPPH 02 


¿st 410. h> 
«sgtdlib.h- 
zuniszd.h- 

ZS Ering. Н> 
«ctype.h- 
<getimp. n» 
«51gnàl.h- 
zsys/rime,.h- 
zSysg/-ypes.Hh» 
«gSyg/wait.h- 


codefinciude/csapp.h 
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14 
15 
15 
17 
18 
19 
20 
21 
22 
43 
24 
2% 
26 
27 
28 
"E 
30 
31 
32 
33 
54 
35 
36 
37 
38 
39 
40 
41 
42 
13 
44 
45 
16 
47 
4% 
49 
50 
51 
52 
53 
54 
55 
26 
31 
28 
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&include «sys/stat.h» 
Ніпсішіес «fcntl.h» 
#1include «syse/mman.h- 
#include zerrno.h» 
Kinclude «math.h- 
&include «pthread.hs 
include «semaphore.h- 
include «sys/socket.h- 
"include «netdb.h- 
*:include «netinet/in.h- 
#:псіцае «arpa/inet.h» 


/* Default file permissions are DEF MODE & DEF_UMASK */ 
$define DEF, MODE 5 TRU&SRiS5 IWUSR|S IRGRP|S IWGRP|S IROCH|S IWOTH 
+#define DEF UMASK 3 IWGRP|S IWOTH 


/* Simphfies calls to bind(), connect(), and accept() */ 
Lvpedef struct sockaddr SA; 


/* Persistent state for the robust ТЖО (Rio) package */ 
*detine RIO BUFSIZE 8:92 
tvpedef struct { 


-nt rio fd; 上 descriptor for this internal buf */ 
int rio cnt; /* unread bytes 1n internal buf */ 
char *rio bufptr; /* next unread byte in internal buf */ 
char rio, buf[RIO 3UFSIZzE];  /*internal buffer */ 

} rio t; 


/* External variables */ 


extern int n errno; /* defined by BIND for DNS errors */ 
extern char **environ;  /* defined by libc */ 


/* Misc constants */ 


Hdef ne MAXLINE 8192 PF max text line length */ 
ЕЗеі:пе MAXBUF 8192 ж max VO buffer size */ 
tdef пе LISTENQ 1024 Ж second argument to listen() */ 


/* Our own error-handiing functions */ 

void unix error(char *msg]; 

void рокіх error(int code, char *msg); 
void dns errorichar *msgq); 

void app error;char *mag!: 


/* Process control wrappers */ 


59 
60 
51 
52 
53 
54 
65 
05 
BT 
58 
69 
79 
71 
72 
73 
74 
75 
76 
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pid E Forkívoid); 

void Execve(consti char *fileaname, char *const атау], char *const елур[]) ; 
pid t Waitíint *status); 

pid t Waitpidipid Li 2id, int "*iptr, int options): 

vold Killipid t pid, int signum!; 

unsigned int Sleepí(unsigned int secs); 

vold Pausei(void); 

unsigned int Alarmí(unsigned inz seconds]: 

void Setpgidipid t pid, pid t pgid); 

pid t Getparp!); 


I* Signal wrappers */ 

typedef void handler t(int): 

handler t *Sidgnalí(int signum, handler t *handler); 

void Sigprocmsskiint how, const sigset t *ser, sigset t *oldset); 
void Sigemptysert(sigset t *set!; 

vold Sigfillsetiísigset t *sek)!; 

void Sigaddsetísigset t *set, ^nt signum); 

void Sigdoelset(sigset t “чек, :nt signum); 

int Sigismemberi(const sigset t *set, int signum); 


4 Unix ШО wrappers */ 

int Openíconst char *parhname, int flags, mode t mode); 

өніге t Read(int fd, void *buf, size L count): 

seize і Wr-te(lnt fd, const void *buf, size t count); 

ofi t Lseektint fildes, off t offset, int whence); 

void Close:int Ға); 

int Select(int n, fd set *readfds, fd set *writefds, fd set *exceptfds, 
struct Eimeval *timeouL):; 

-nt Dupzíint аА, inc #а2); 

void Stat[const char *filename, siruct stat *buf!: 

void Fstatiint fd, struct stat *buf) ; 

Ж Memory mapping wrappers */ 

void *Mmap(void *addr, size t len, int prot, inl flags, int fd, off.L offset]; 

void Munmap(void *start, size t length}; 


/* Standard [O wrappers */ 

уо1а FcloseiFILE сір); 

FILE *Fdopeniint fd, const char *tvpej; 

char *Fgeigíchar *ptr, ілі n, FILE *stream!; 
FILE *Fopeniconst char *filenàme, const char *mode!; 

void Fputsí(const char *ptr, FILE *stream); 

size t Fread(void *ptr, size t size, size t nmemb, FILE *stream); 
void Fwrite(const void *ptr, size t size, size t nmemb, FILE *stream!; 
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/* Dynamic storage allocation wrappers */ 

void *Mallcce (slze_t Біге); 

void *Reallocí(void *р г, size t size); 
void *Callocí(size t memb, size t size); 
void Freeívoid *ріг}; 


/* Sockets interface wrappers */ 

int Socketí(int domair, int type, int protocol); 
void Setsockopt(int s, int level, int optname, const void *optval, int optlen!; 
void Віла (іп sockfd, struct scckaddr *my addr, int addrlenj; 
void Listerí(int s, int back.oq); 

int Асеері {1пі s, struct sockaddr *addr, int *addrlenj; 

void Connect (int sockíd, struct sockadür *serv addr, int addrlen!; 


/* DNS wrappers */ 
struct hostent *Gethostbynameiconst char *name!; 
sLruct hostent *Gethostbyaddríconst char *addr, int len, int сүре); 


上 Pthreads thread control wrappers */ 
void Pthread createí(pthread t *tidp, pthread attr t *a-trp, 
void * i*routine)ívoid %), void *argp;; 
void Рклгеай joiní(pthread t tid, void **thread return); 
void Ptaread cancelipthread t tid); 
void Ptauread derachípethread t tid); 
vöid Ptáread exití(void *retval); 
pthread,t Pthread selfí(void!; 
void Pthread orceí(pthread once t *once control, void (*init functien)):: 


/* POSTX semaphore wrappers */ 

void бет init(sem t *sem, int pshared, unsigned int value; 
void P(sem t *sem); 

void Уізет с *sem!; 


f* Rio (Robust UO) package */ 

ssize і rio readníiint fd, void *usrbu?, size t n); 

ss1ze t rio writeníiint fd, void *usrbuf, size t n); 

voic гіз readinito2í(rio t *rp, int fd): 

Ssize t rio readnoi(rio t *rp, void *usrbuf, size t n); 

$81ze t rio readlinebírio t *rp, void *usrbuf, size.t maxlen); 


/* Wrappers for Rio package */ 

вві?е 1 Rlo readniint fd, void *usrbu*, size t n); 
vol Rio writen(int fd, void *usrbuf, size t m): 
void Rio readinitaí(rio t *rp, int Ға); 


B.4 
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26 
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/* Chent/setver helper functions */ 
int open clientfíü(char *hostname, int portno); 
int open, listenfdí(int portno); 


/* Wrappers for client/server helper functions */ 
int Open clientfd(char *hostname, int port); 
int Open, listenfd(int port!; 


Kendif /* |, CSAPPH | */ 


csapp.c 源 文 件 
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ssize t Rio readnbiírio t *rp, void *usrbuf, size t n); 
өні?е t Rio readlinebí(rio t *rp, void *usrbuf, size t maxlen]; 
code/include/csapp.h 
code/src/csapp.c 


&include "csapp.h" 


Pio 8 9 ok ok ж ЖЕЖ ЖЖЖ Ж Ж 


* Error-handling functions 


xk doe ok dex ЕЕ Ek E e y 


void unix,error(char *msg) /* unix-stvle error */ 


l 
fprintfístderr, 
exit (0); 


“Ес: s\n", msg, strerror(errno]); 


vold posix_error(int code, char *msg) /* posix-style error */ 


{ 
fprintfístderr, 
ex1t (Ú); 


^s: $sin", msg, strerrorícode!); 


void dns, error(char msg} /* dns-style error */ 


l 
Zprintfístderr, 
ехі (0); 


"Ес: DNS error $din", msg, h er-no); 


vOiC ару erroríchar *msg) /* application error */ 


fprintfí(stderr, 
exit(0); 


"Ұсал”, msg); 
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28 ) 
29 
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31 * Wrappers fot Unix process control functions 


32 жк Ж oo ЕЕ Ж ak OR Ж ОККА K SE ge geo oe R ЖЕЖ “жж 宝洁 
33 

34 pid t Forkivoid) 

35 [Í 

36 різ t pid; 

37 

38 if {ipid = fork()) < 0) 

38 unix errorí"Fork error"]; 
AQ return pid; 

4] } 

42 


43 void Execve {const char *filename, char *const argv[], char *const envp[]? 
44 { 


45 if (ехесуе{Ё11епаше, argv, envp) < 0) 
46 unlx errorí"Execve error"); 

AT |] 

48 

49 pid t Wait(int *status) 

3ü { 

51 pid t pid; 

DŽ 

53 if {{pid = waitístatus)) < 0) 

54 unix, errorí("Wait error"); 

55 return pid; 

56 ) 

57 

58 ора t Waltpid(pid t pid, int *iptr, int options) 
59 { 

5t) pid t retpid; 

51 

52 if [i;retpid = waitpid(pid, iptr, options)! < 0) 
63 unix errorí("Waitpid error"); 

54 returníretpid); 

65 ] 

БВА 

67 void Kill[pid t pic, int signum) 

6B f 

59 int rc; 

70 

7] if ((rc = killipid, signum]) < 0) 


72 unix error("Xill error"); 
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void Рацве{(} 

1 
(voidi)pauseil; 
return; 


unsigned int Sleep(unsigned int secs) 
{ 


unsigned int rc; 


ii {{тс с sleepiísecs?] < Ü 
unix errcr["5leep error"); 
return rct; 


unsigned int Alarmí(unsigned int seconds?) 1 
return alarmíseconds!; 


void Setpgidí(pid t pid, pid t paid) { 
int rc; 


if (irc = setpgid(pid, pgid)) < 0j 
unix errorí("Setpgid error"); 
return; 


pid t Getpcrpivoid) 1 
return getpgrpí)]; 


{КЕКЕ ЕЖЕ ЕР oro doe e e jeg dede 


* Wrappers for Unix signal functions 
ck kdo ЕК Ж ok ЖЖ КЖК EEEE EEEE жж ЕЖЕ, 


handler t *Signaltint signum, handler t *handler) 
{ 


struct sigaction action, old_action; 


action.sa handler - handler; 
sigemptyset(&action.sa, mask); /* block sigs of type being handled */ 
acLion.sa flags = SA RESTART; /* restart syscalis if possible */ 


816 ж В 


118 if (sigaction(signum, &action, &old action) < 0) 
119 unix, error("Signal error"); 

120 reLurn (old action.sa handler]: 

121 ] 

122 


123 void Sigprocmaskí(int how, const sigset t *set, sigset t *oldset) 
124 | 


125 if (sigprccmàsktihow, set, oldsetj < C) 
126 unix errorí("Sigprocmask error"); 
127 return; 

128 ] 

129 

130 void Sigemptysetí(sigset t *set) 

131 | 

132 if (siqemptyset (set) < 0) 

133 unix, errorí"Sigemptyset error"); 
134 return; 

135 ] 

136 

137 void Sigfillsetí(s:igset t *set) 

138 i 

139 if (sigfillseriíset) < 01 

140 unix,errorí"Sigfillset error"); 
141 return; 

142 } 

143 

144 void Sigaddsetísigset t *set, int signum) 
145 1| 

146 1Ё i81igaddsetíset, signum) < 0} 

147 unix errorií"Sigaddset error"); 
148 return; 

149 } 

150 

151 void Sigdelsetisigset t *set, int signum) 
152 | 

153 if [sigdelsetíset, signum) < 0) 

154 unix error("Sigdelset error"!; 
155 return; 

155 } 

157 


158 int Sigismember[const sigset t *set, int signum) 
159 { 

160 int КЄ; 

161 if {ire = sigismemberí(set, signum)) < 0) 

162 unix error("Sigismember error"); 
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63 return rc; 

164 } 

165 

165 

167 ржака ОКК EEE. 

168 * Wrappers for Unix UO routines 

169 LLE EELE EEEE EE EEEE T EEES EEE ETE EE ek] 

170 

171 int Openíconst char *pathname, int flags, mode t mode) 
172 { 


173 int rc; 

174 

175 if iirc = ореп (pathname, flags, mode)]) < 0) 
176 unlx еггегі"Ореп error"); 

177 return rc; 

178 } 

178 

180 ssize t Read(int fd, void *buf, size t count) 
181 | 

182 есіте t rc; 

183 

184 itf ((rc = геад (їз, buf, counti] < 0) 

185 unix errorí("Read error"); 

186 return го; 

197} 

188 


189 ssize t Wribe(int fc, const veid *buf, size t count) 
190 i 


191 әбі?е t rc; 

192 

193 if {ire = writetfd, but, count)) < б) 

194 unix errorí('Write error"): 

195 return rc; 

196 1 

197 

198 off t Lseek(int fildes, off t offset, int whence) 
199 i 

200 ott t rc; 

201 

202 1f ((rc = iseek(fildes, offset, whence)) < 0) 
203 unix errorí(*Lseek error"); 

204 return rc; 

225) 

206 


207 void Close(int tid! 
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208 f 

20% inb rc; 

210 

211 if (irc = closeifd)) < D| 

212 unix еггог(“С1оѕе error"); 

21i | 

214 

215 int Selectiint n, fd set *readfds, fd set *writefds, 
216 fd set *exceptfds, struct timeval *timeocvt) 
217 Í 

218 -nt rc; 

219 

296 LË (irc ғ selectin, readtds, writefds, exceptfds, timeout!) < 0) 
221 unix_errori"Select error"); 

222 return ге; 

223. ] 

224 

225 int Dup2[(int fdl, int Ға2) 

226 1 

A4 -nt rc; 

ҒҰА: 

229 17 {ГЕС = dup2i£dl, fd2)) < 0) 

230 unix_error |"Dup? error"); 

231 reLurmn rc; 

232 |] 

233 

234 void Statí(const char *filename, struct stat *buf) 
235 ( 

236 1Ё (statí(I:lename, buf!) < 0) 

237 unix errorí"Stat error"); 

238 } 

239 

249 void Fastat tint fd, struct stat *buf) 

24. d 

242 if (fstatí(fd, buf) < 0} 

243 unix error("Fstal error"); 

244 00) 

245 
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247 * Wrappers for memory mapping functions 
248 ажаа кф Быр, 


249 void *Mmap(void *addr, size L len, int prct, int flags, int fd, off r offset) 
25Ü Í 

ab vold *ptr; 

252 
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if { (ріг = mmap(addr, ien, prot, flags, fd, offset)) == ((void *] -1)? 
unix errorí("mmap error"); 
returmníptr): 


vold Munmapívoid *start, size t length) 


{ 


if (munmap([(start, length] < 8) 
unix,errorí"munmap error"); 


Ji Kobe opc geek KK KR ЖЖЖ joke oko dolo ook deo oe ЖЖ ЖЖЖЖ КЖ жж ЖЖ 


* Wrappers for dynamic storage allocation functions 
EEE EEEE ЖЖ жЕКЕ ЖЖ ЖЖ КЖЕ КЖК ЖА АЖ E E E E E E E E E 


void *Mallocisize t size) 


( 


vold *p; 

1f (ір = mallocísize]) == NULLI 
unix errorí'Malloc error"); 

return p; 


void *Reallocívoid *ptr, size t size) 


t 


void *p; 


if (ip = reallocí(ptr, sizel) == NULL) 
unix, errorí("Realloc error"!; 
return p; 


void *ÜCallocí(size t nmemb, Бізге і sizə) 


{ 


vold *э; 


if {ip = callocinmemb, size]) == NULL) 
unix, errorí("Cal.oc error"); 
return p; 


уоій Free(void *prr) 


l 


Iree(ptr); 
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301  * Wrappers for the Standard UO functions. 


302 ЖЖЖЖ Ж F F F F F OF ЕЖЕ Ж ЕЕ ЕКЕ ee GE / 


303 void FClose(FILE *Ip) 


304 ( 

303 if [fclosetfp) != 0) 

305 unix erroríi"Fclose error"); 

307 } 

308 

309 FILE *Fdopení(int fd, const char *type) 
alJ | 

311 FILE *fp; 

312 

313 1Т “Тір = Ғаореп{ Ға, type)) == NULL) 
314 unix errori"Fdopen error"): 

315 

315 return fp; 

217 } 

318 

319 char *Fgets{char “рег, int n, FILE *stream) 
320 { 

321 char *rptr; 

322 

323 if it(rpir = fgets(ptr, n, stream)) == NULL) && ferroríistream)) 
324 app error("Fgets error"); 

325 

326 return rptr; 

327 ] 

328 


329 FILE *Fopeni(const char *filename, const char *mode) 
330 | 


331 FILE *Ёр; 

132 

332 if iip = EFopen(tilename, model) == NULL! 
334 unix, errorí("Fopen error"]: 

ii5 

336 return fp; 

3370) 

338 

339 уо14 Fputsiconst char *ptr, FILE *stream) 
340 ( 

341 if ifputs(ptr, stream) == ЕСЕ) 


342 unix errorí("Fputs error"): 
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slzë t Freadí(void *ptr, size t size, size t nmemb, FILE *stream) 
i 


өзге t n; 

ii (iin = Ігездіріг, size, nmemb, stream)) < nmemb) && ferrorí(stream)) 
unix, error("Fread error"]; 

return n; 


) 


void Fwrite(const veid *ptr, size t size, size t nmemb, FILE *stream) 
[ 
if (fwriteíptr, size, nmemb, stream) < птеп) 
unix errori'Fwrite error"); 


JRR333 dol ok dolor doce olco doloe EEE 


* Sockets interface wrappers 
Жж ЖЕЗ Ж ЖЖК KER R d E R ORAR / 


int боскесііті demain, int type, int protocol) 
{ 


int rc: 


lif ((rc = socket (domain, type, protocol)] < 0) 
unix еггог{ "оске error"); 
rerurn гс; 


void Setsockopt(int s, int level, int optrame, const void *optval, int optlen) 


| 


int rc; 


itf {ire = setsockoptís, level, optname, optval, optlen)) < 0) 
unix errorí("setsockopt error"); 


void Bind(int sockfd, struct sockaddr *my addr, int addrlen) 
{ 


int тє; 


if {ire = bindí(sockfd, пу адат, addrlen!)) < 0) 
unix errorí("Bind error"); 


&22 ИЖ В 


388 ] 

383 

390) void Listení(int s, int backlog} 

351 | 

192 int тє; 

393 

394 iL itre = listen(s, backloq)) < 0) 
395 unix errorí"Listen error"); 
396 } 

397 

398 int Acceptíint s, struct sockaddr *addr, int *addrien) 
389 í 


400 inL rc; 

402 

402 12 {ire = acceptís, addr, adarlen)) < 0} 
403 unix error["Accept error"); 

404 return rc; 

405 ] 

406 


407 void Connectíint socktd, stract sockaddr *serv, addr, int addrlen! 
4084 


408 ілі rc; 

JLE 

411 if [irc = connectí(sockfd, serv адаг, agdrleni) < 0) 
412 unix errorí"Connect error"); 

413 ] 

414 
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416  * DNS interface wrappers 


417 ААА 


418 

419 struct hostent *Gethostbyname(const char *name) 
420 | 

421 struct nostent *p; 

422 

423 if (ір = gethostbyname(name])! == NULL! 

424 dns errorí("Gethostbyname error"): 

325 return р; 

АЛБ } 

427 


128 struct hostent *Gethostbyaddrí(const char *addr, int len, int type) 
429 í 


430 Struct tostaent *p; 
431 


432 if iip = ge:hostbyaddr(addr, len, type) == NULL) 


433 
234 
435 
436 
437 
438 
439 
440 
441 
442 
443 
444 
445 
446 
447 
448 
449 
450 
481 
452 
153 
454 
455 
456 
457 
458 
459 
460 
461 
462 
463 
464 
465 
466 
487 
488 
4639 
470 
471 
472 
173 
474 
475 
475 
АТ? 


3541421 
dna errorí"Gethostbyaddr error"); 


retur” р 
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* Wrappers for Pthreads thread control functions 
ЖЕЖ к ЖЕ Ж ЖЖЖ EEEE EE EEE ESEE ETE EEEE E EEE EEEE elo 


чсїа Prhread createipthread t *tidp, pthread attr t *attrp, 
void * (*routiner(void *), void *argp! 


int rc; 
if (irg = pthread createi(tidp, attrp, routine, агар}! (= 0) 
posix errorirc, "Pthread create error"): 
Void Prhreađd_cancel (pthread t tid) 1 
int rc; 
if iire = ptaread canceli(tid!)!) !- 0) 
posix errorí(rc, "Pthread.cancel error"); 
void PLhread joiní(pthread t tid, void **thread return! { 
int rc: 
if {irc = pthread, joinítid, thread return)) 1- 0) 
ровіх errorirc, "Prhread join error"): 
void Pthread 3etachipthread, t tid) Í 
in- rc; 
1f [irc = pthread detachí(tid)) != 0) 


posix errorirc, "Pihread detach error"i!; 


void Pthread exití(void *retval) { 
pchread exití(retval!; 


pLhread, t Pthread self (void} 1 
returr pthread selfí); 


823 
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478 

479 void Pthread oncei(ptnread once t *once control, void i(*ini- fvunction)í(]]) í 
450 pthread, опсе(опсе сопіго1, init, function); 

dgl + 

482 


483 ржака EEEE 


484 — * Wrappers for Posix semaphores 


485 ko жж жк к ж EEEE eee eee 
4856 


487 void бет іпії (semt *sem, int pshared, unsigned int value) 
488 d 


489 if [sem ini-ísem, pshared, value) < 0) 
490 unix, errori"Sem init error"); 
491 } 

492 

193 void Р{веш t *sem) 

492 Í 

495 if (sem wait (sem) < G) 

496 unix errorí"P error"); 

497 ] 

498 

495 void Visem t *sem) 

506 + 

501 if (sem_posr (sem) < C) 

502 unix_error{"V error"): 

803 ] 

504 


ЫЛЫ ЕЯЯЖЕежжж ЖЕ ЕЖЕЖЖ ҰЯ lE E E EE LE EE EE ЖЕЖ EE ETET ҰЕЖ de TE EE EEEE EE 


506 — * The Rio package - robust UO functions 


07 Жжжж Ж Жж dede oe lop Ж КЖЕ Ж КЖ ЖА ЖОЖ doloe oec ККЕ Ж oe жж ЖЖ жж Ж 
50g /* 
509 “то readn - robustly read n bytes (unbuffered) 


510 * 

511 ssize t rio readn(int fd, void *usrbuf, size t n) 
512 [Í 

513 Size t леї = n; 

514 cS8ize t nread; 

515 char *bufp = usrhbuf; 

515 

517 while (nleft > 0) Í 

518 1Е f(nread = reac(fd, bufp, nleft)) < 0) | 
519 if (errno == EINTR) /* interrupted by sig handler return */ 
520 nread - 0; /* and call read() again */ 
521 else 


522 return -1; /* ermo set by read() */ 


错误 处 理 825 





} 
else if ínread == 0) 
break; Ж EOF */ 
nleft -- nread: 
bu^p += nread; 


) 


return (n - nle£ft]; /* return >= 0 */ 
J 
/ * 
* rio. writen - robustly write n bytes (unbuffered) 
ж/ 


Ssize t rio writen(int fd, void *usrbuf, size t n) 
i 

size t nleft = n; 

sslze t nwritten; 

char *bufp = usrbuf; 


while (nleft > 9) 1 
if (ínwritten = write(fd, bufp, nieft)!) <= D) 1 


if (егепс == EINTR) /*intemupted by sig handler return */ 
nwritten - /* and call write() again */ 
else 
return -.; /* егготпо set by write() */ 
| 
nlefbE -= nwritten: 


bufp += nwritten; 
) 


return n; 


/ * 

* rio read - This is a wrapper for the Unix read() function that 

* transfers min(n, rio, cnt) bytes from un internal buffer to a user 

* buffer, where n is the number of bytes requested by the user and 

* rio ent is the number of unread bytes in the internal buffer. On 

* entry, rio, read() refills the internal buffer via a call to 

* read() if the internal buffer is empty. 

*/ 
Static ssize t ric readlrio б *rp, char *usrbuf, size L n) 
{ 


1 


int cnt: 


while (rp-»rio cat <= 0) { A refill if buf is empty */ 


826 ИЖ. B 


KAH rp-»rio cnt = readírp-»rio Ға, rp-»rio buf, 

569 sizeofí(rp--r.o bufl!: 

570 if Irp->rlo_cnt < D) | 

571 if (errno != EINTR} /* interrupted by sig handler return */ 
572 return -1; 

573 ) 

574 clse if (rp-»rio cnt == 0) Æ EOF */ 

575 return у; 

576 else 

KFY rp-»rio bufptr = rp-»rio buf; /* reset buffer ptr */ 
n78 } 

S78 


580 /* Copy minin, rp-»rio cnt) bytes from internal buf ta user buf */ 
581 cnt = n; 

582 if irg-»rio_cnt < n) 

583 CELL = rp-»rio cnt; 

584 memcpyt(usrbuf, rp-»-rio bufptr, crt]; 

585 rp-»rio butptr += cnt; 


586 foO-»-rio cnt -= cnt; 
587 return спі; 

S688 } 

589 

Sgg ух 


59: “по readinith - Associate a descriptor with a read buffer and reset buffer 
592 “; 

193 void rio readinitb(rio t *rp, int fd) 

594 1 

595 rp-»rio td - fd: 

595 rp-»rio спі = 0; 

597 -Tp-»rio bufptr = rp-»rio buf: 

59E jJ 

589 

600  /* 

601  *rio readnb - Robustly read n bytes (buffered) 

602  */ 

603 ssize t rio readnbí(rio t *rp, void *usrbuf, size t n) 
8041 1 


= 


505 size t nle-t = n; 

506 sslze t nread; 

507 char *bufp = usrbut; 

608 

509 while (nleft > 0) ! 

610 if ((nread = кіс read{rp, bufp, nleft)) < 0} { 

611 if {errno == EINTE] /* interrupted by sig handler return */ 


612 nread - 0; /* call read() again */ 


/ 


5 


Í 


Hr XC 


else 
return -1; /* ermo set by read() */ 
) 
eise if ínread == 0) 
break; /* EOF */ 
nleft -z nread; 


bute += nread; 
} 
return in - rleft);  /*retum-() */ 


* 


* по readlineb - robustly read a text line (buffered) 
* z 
size t rio readlineb(rio t *rp, void *usrbuf, size t пах: еп) 


int n, ге; 
char с, *bufp = usrbhbuf; 


for (n = 1; n < naxlen: п++} 1 
if idre = rio readirp, кс, 1)) == 1} Í 
*þufp++ = c; 
itf (c == '\п') 
break; 
ү else if irc == Q) í 
if in == i! 
return 0:  /* EOF, no data read */ 
else 
break: /* EOF, some data was read */ 
] eise 
return -1; /* error */ 
} 
*butp < ü; 
return n; 


Joke doe жЕ вафое 


t Wrappers for robust FO routines 
ККК КККК КЕ КЕККЕ dio doeet КЖ) 


85іге t Rio геайпіігі fd, void *ptr, size t nbytes) 


[ 


SSsize t n; 


if {in = rio readn(fd, ptr, nbytes)) < 0) 
unix еггог ("Біо r-eadn error"); 
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588 return n; 

659 } 

БЕП 

561 void Rio writeniint fd, void *usrbuf, size t п) 
562 [Í 

563 if (rio writenifd, usrbuf, n) != n) 

564 unix error("Rio writenb error"); 

565 ) 

655 

567 void Rio readinitbírio t *rp, int Ға) 

568 1 

663 r:o readinitbirp, £d); 

B70 |] 

571 

672 я1те t Rio readnhí(rio t *rp, void *usrbuf, size t г) 
573 f 


74 size_t rc; 

б 5 

576 it {ire = rio геайпрікр, usrbuf, п)) < 0) 
577 unix error("Rio readnb error"); 

68 return rc; 

579 1 

5 8 Ü 


68% ssize t Rio_readlinebirio_t *rp, void *usrbuf, size t шах1еп) 
682 d 


553 Бетте t rc; 

684 

68^ itf (irc = rio readlirebírp, usrbuf, maxlen)] < 0) 
BE unix_error{"Rio_readlineb error"): 

687 return го; 

68^ } 

585 


590 ФКК АСЕ ЕКЕЖ КЕ 


591  *Client/server helper functions 

5987 R U E pE ok E еы рН 

592 /* 

694  * open clientfd - open connection to server at «hostname, port> 
695  * and return a socket descriptor ready for reading and writing, 
696  * Returns -| and sets етгпо on Unix error. 

697  * Returns -2 and sets h erro on DNS (gethostbyname) error, 
698  */ 

699 int open clientfd(char *һоѕілате, int port) 
700 1 

701 int clientfd; 

702 struct hostent *hp; 


703 
494 
105 
706 
107 
708 
709 
710 
711 
712 
713 
714 
715 
716 
717 
718 
119 
720 
721 
722 
223 
724 
725 
726 
727 
728 
129 
+30 
731 
732 
733 
734 
735 
136 
137 
738 
739 
740 
741 
142 
743 
744 
745 
746 
741 


/ 


жалы 


struct sockaddr іп serveraddr; 


if 


(iclientfd = socket(AF INET, SOCK STREAM, 01) < 0) 


return -1; /*check errmo for cause of error */ 


/* Fill 1n the server's IP address and port */ 
if (ihp = gethostbyname(hostname) | 
return -2; /*check h епо for cause of error %/ 


bzeroitichar *) 


&serveraddr, sizeof { 


serveraddr.sin, family = AF_INET; 
bcopy (ichar *)hp-»h addr, 


(char *J&serveraddr.sin addr.s addr, hp-»h length); 


serveraddr.sin, port = htonsíport): 


/* Establish a connection with the server */ 


ii 


return -1; 


return clientfd; 


| 


(connect (clientfd, 


(SA *) &serveraddr, 


-- NULL) 


aerveraddr)); 


ж open, listenfd - open and return a listening socket on port 
Returns -1 and sets ermo on Unix error. 


Ж 


“/ 


int open, listenfdíint port]! 


I 


int listenid, optval-l; 
struct sockaddr in serveraddr: 


/* Create a socket descriptor */ 
if (í(listenfd = socket (AF_INET, SOCK STREAM, 0)) < 0) 


return -1: 


/* Eliminates "Address already in use" error from bind. */ 


if 


[(setsockoptilistenfd, SOL SOCKET, SO REUSEADDR, 


(const void *j&optval , sizeofiint]) < 0) 


return -1: 


/* Listenfd will be an endpoint for all requests to port 
on any IP address for this host */ 


hz 


eròi [char *) &serveraddr, 


8erveraddr.sin family = АҒ ІМЕТ; 
serveraddr.sin addr.s адаг = htonlíINADDR ANY): 
serveraddr.sin port = htons((unsigned shortlport)!; 


if 


(bindilistenfd, 


(SA *lkserveracddr, 


sizeofíserveraddr)?); 


slzeofí(serveraddr)! 


“4 


0 


\ 
у 


829 


eizeofí(serveraddr); < 0) 


530 


748 
249 
750 
751 
752 
753 
194 
755 
156 
ЕУ 
ған 
759 
760 
761 
762 
763 
764 
755 
766 
T6! 
758 
765 
FTO 
ғы 
ШУ. 
Е: 
ШЕ. 
УТА 
TIG 
Yu 
PP 
119 
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return -1; 


/* Make it a listening socket ready to accept connection requests */ 
if (listenilisrtenfd, LISTENQ) < 0) 

return -i; 
return listenfdü; 


{киик к Жж ЕУ ЖЕ ЕЖЕ ЖЖ ЕЖЕ ЖК КОЕ Ж ИЖ EEE ЖЖ 


* Wrappers for the client/server helper routines 
жк оч ао ЖККУ ЕЖЕ КЕЕ К ЕК) 
int Open clientfdí(char *hostname, int port) 
{ 

int rc; 


1Ї irg = open, clienttdihostname, рогі) } < 0) ( 
if (rc == -1) 
unix етгот { "Ореп clientfd Unix error"); 
else 
dns error("Open clientfd DNS error"): 
| 


return rc; 


int Open listenfd(int port) 
l 


int rc; 
rt [irc = open listenfdiporc)) < D) 


un!z error("Open liztenfd error": 
return rc; 


code/sre/csapp.c 


